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Zusammenfassung 


Die Lehr-Lern-Interaktion ist ein aufeinander bezogenes Handeln von mindes- 
tens einer Lehrperson und einer lernenden Person (vgl. Hofer & Haimerl, 2008). 
Sie ist beschreibbar als ein komplexes und auch dynamisches Konstrukt (Knie- 
rim et al., 2017; Koopmans & Stamovlasis, 2016; Perrez et al., 2006; Thies, 
2017), das mit verschiedenen Variablen in Lehr- und Unterrichtssituationen im 
Zusammenhang steht, z. B. Leistung, Motivation und sozial-emotionaler Kompe- 
tenz. In den Analysen von Hattie (2015) belegt die Lehr-Lern-Beziehung einen 
hohen Platz unter den bedeutsamsten Variablen fiir die Lernendenleistungen und 
-einstellungen in der Schule. Nickel (1985) postulierte in seinem transaktiona- 
len Modell der Lehr-Lern-Interaktion, dass der soziokulturelle Kontext, in dem 
sich Menschen befinden, kognitive Schemata durch Sozialisations- und Erzie- 
hungserfahrungen bestimmt. Solche Schemata, wozu u. a. Erwartungshaltungen 
zählen, beeinflussen die Wahrnehmung der Unterrichtssituation sowie das Ver- 
halten in ebendieser. Dies läuft zeitgleich bei Lehrpersonen und Lernenden ab, 
die in zirkulärer Wechselwirkung stehen. Eines der bekanntesten Phänomene, 
die die Lehr-Lern-Interaktion beeinflussen können, ist der Pygmalion-Effekt 
(Rosenthal & Jacobson, 1966, 1971), der die Auswirkungen von Lehrenden- 
kompetenzerwartungen an Lernende beschreibt. Geht eine Lehrperson von einer 
kompetenten lernenden Person aus, verhält sie sich u. a. freundlicher, zuge- 
wandter und gibt mehr Gelegenheiten zur Kompetenzsteigerung (u. a. Harris & 
Rosenthal, 1985; Rosenthal, 1994). Dadurch bestätigen sich die Erwartungen der 
Lehrperson. 

Der Pygmalion-Effekt ist vielfach untersucht. Seltener im Fokus stehen die 
Kompetenzerwartungen der Lernenden an die Lehrpersonen. Nichtsdestotrotz 
zeigte sich eine positive Wirkung hoher Lernendenkompetenzerwartungen an 
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Lehrpersonen auf die Lernenden selbst, z. B. hinsichtlich Lernleistung oder Ver- 
halten (u. a. Jamieson et al., 1987). Wenig ist jedoch über die diesbezügliche 
Wirkung auf die Lehrpersonen bekannt. Die wenigen Befunde sind dabei teil- 
weise widersprüchlich bzw. uneindeutig (Feldman & Prohaska, 1979; Feldman & 
Theiss, 1982). Deswegen wurden in Anlehnung an das Modell von Nickel (1985) 
Lernendenkompetenzerwartungen schrittweise empirisch betrachtet. 

Zuerst wurde die Bedeutung des soziokulturellen Bezugsrahmens für die Aus- 
bildung von Kompetenzerwartungen für verschiedene Gruppen von Lehrkräften 
adressiert sowie klassische Geschlechts-Professions-Assoziationen (u. a. Nosek 
et al., 2009) untersucht. Weder in Studie 1 (N = 145) auf Basis von bild- 
und textbasierten Fallvignetten noch in Studie 2 (N = 254) mit ausschließ- 
lich textbasierten Fallvignetten konnten Geschlechts-Professions-Assoziationen 
für die Unterrichtsfächer Mathematik und Deutsch ausgemacht werden, wenn für 
die Wärme- und Attraktivitätsbeurteilung kontrolliert wird. Anschließend stand 
in der Studie 3 das nonverbale Verhalten in Abhängigkeit von Lernendenkom- 
petenzerwartungen an Lehrpersonen im Fokus. In einer Laborstudie wurden 
systematisch die Kompetenzerwartungen an eine Lehrperson (in einem Video) 
manipuliert und das nonverbale Verhalten der Teilnehmenden (N = 62) auf Basis 
von Videoaufnahmen ausgewertet. Es konnten Effekte für den Blickkontakt aus- 
gemacht werden: Bei hohen Kompetenzerwartungen hielten die Teilnehmenden 
kürzere Zeit den Blickkontakt und sie sahen häufiger weg. Außerdem stütz- 
ten sie (marginal signifikant) ihren Kopf seltener ab. Schließlich wurde in der 
vierten Studie dem Zusammenhang des ersten Kompetenzeindrucks, den Lehr- 
personen machten, mit der Beurteilung einer Lehrveranstaltungssitzung und der 
Lehrpersonen — sowohl von Lernenden (N = 871 Angaben; Mehrfachteilnahmen 
möglich) als auch von den Lehrpersonen selbst (N = 41) — nachgegangen. Es 
zeigte sich mehrebenenanalytisch (unter Kontrolle des Wärmeeindrucks und der 
Attraktivitätsbeurteilung), dass die Lernendenkompetenzerwartungen positiv mit 
motivationalen Variablen (Interesse und Langeweile) und negativ mit dem Erleben 
von Störungen und Störungsmissmanagement aufseiten der Lernenden auf Grup- 
penebene (between) zusammenhingen – die Individualebene (within) hatte kaum 
Bedeutung. Der Einfluss der Lernendenkompetenzerwartungen auf die Lehrper- 
sonen war unsystematischer: Es zeigten sich positive Zusammenhänge mit dem 
Erleben der eigenen Kompetenz und von positiven Emotionen sowie ein negativer 
Zusammenhang mit dem Erleben des eigenen Störungsmissmanagements. 

Zusammengefasst zeigte sich, dass Lernendenkompetenzerwartungen an Lehr- 
personen insgesamt die Lehr-Lern-Interaktion beeinflussen können. Die Effekt- 
stärken sind jedoch zumeist eher klein, insbesondere bei der Wirkung auf die 
Lehrpersonen selbst. Die Ergebnisse können im engen Sinn im Hinblick auf 
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die Bedeutsamkeit der Gestaltung des ersten Eindrucks interpretiert werden. 
Folglich ist es für Lehrpersonen förderlich, u. a. durch Stimmmodulation einen 
kompetenten Eindruck zu vermitteln. Weitergehend sind die Befunde aber auch 
bedeutsam für die Gestaltung der Lehr-Lern-Interaktion insgesamt, z. B. im Hin- 
blick auf Machtdynamiken. Schließend wird ein synergetisch-systemischer Blick 
(u. a. Haken & Schiepek, 2010) auf Kompetenzerwartungen in der Lehr-Lern- 
Interaktion geworfen. Erwartungen und kognitive Schemata von Lernenden sind 
wirksame Einflüsse in der Lehr-Lern-Interaktion (vgl. Nickel, 1985), es sind aber 
weitere Untersuchungen nötig, um die Effekte von Lernendenkompetenzerwar- 
tungen valide beschreiben zu können. 
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Die Lehr-Lern-Interaktion 


Das Bildungssystem, darunter insbesondere Schulen und Hochschulen, tiber- 
nimmt nach Fend (2009) vier gesellschaftliche Funktionen: 


1. Enkulturationsfunktion: „Reproduktion grundlegender kultureller Fertigkeiten 
und kultureller Verstaéndnisformen“ (Fend, 2009, S. 49) 

2. Qualifikationsfunktion: Vermittlung von Fertigkeiten und Kenntnissen, „die 
zur Ausübung ‚konkreter‘ Arbeit erforderlich sind“ (S. 50) 

3. Allokationsfunktion: „Aufgabe, die Verteilungen auf zukünftige Berufslauf- 
bahnen und Berufe vorzunehmen“ (S. 50) 

4. Integrations- und Legitimationsfunktion: Schaffung einer Identität, „die die 
innere Kohäsion einer Gesellschaft mitbestimmt‘“ (S. 50), und „Schaffung von 
Zustimmung zum politischen Regelsystem“ (S. 50) 


Diese und weitere Aufgaben (z. B. Hochschule und Schule als Arbeitgeberin- 
nen) müssen in einem komplexen Zusammenspiel unterschiedlicher Systeme aus 
individuellen Bedürfnissen von Personen verschiedener Gruppen (u. a. Lehrperso- 
nen, Lernende und Erziehungsberechtigte), institutionellen Rahmenbedingungen 
sowie gesellschaftlichen und kulturellen Vorstellungen geleistet werden. Eine Bil- 
dungseinrichtung ist ein komplexes, dynamisches System und „[...] umfaßt das 
Systemganze (die [...] Schulklasse einschließlich Lehrer [...]), die Systemele- 
mente selbst (die Schüler, die Lehrer, ggfs. die Schulleiter, die Schulordnung, 
usw.) und die wechselseitigen Beziehungen zwischen diesen Elementen (z. B. 
Lehrer-Schüler-Beziehungen)“ (Brunner & Huber, 1991, S. 386). 

Für die Aufgabenerfüllung des Bildungssystems ist die Lehr-Lern-Interaktion 
und -Beziehung wesentlich und wichtig. Sie kann angelehnt an Hofer und 
Haimerl (2008; s. a. Rosemann, 1978) wie folgt bestimmt werden: Die Lehr- 
Lern-Interaktion ist ein aufeinander bezogenes Handeln von mindestens einer 
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lehrenden und mindestens einer lernenden Person!. Sie ist ein multidimensiona- 
les, komplexes und dynamisches Konstrukt (Knierim et al., 2017; Koopmans & 
Stamovlasis, 2016; Perrez et al., 2006; Thies, 2017) und steht in der Schule 
im Zusammenhang mit Leistung, Motivation, der sozial-emotionalen Kompetenz 
(vgl. Knierim et al., 2017; Quin, 2016) und trägt zur Persönlichkeitsentwicklung 
bei (Siebertz-Reckzeh & Hofmann, 2017). Auch im Hochschulbereich zeigten 
sich positive Effekte fiir eine gelungene, zugewandte Interaktionsgestaltung (u. a. 
Komarraju et al., 2010; Micari & Pazos, 2012). 

In den Betrachtungen von Hattie (2015) rangiert die Lehr-Lern-Beziehung 
auf Platz 11 der bedeutsamsten Variablen für die Lernendenleistungen 
und -einstellungen im schulischen Kontext mit einer mittleren Effektstärke von 
d = 0.72. Bei Hattie (2015) wurde jedoch ausschließlich die Meta-Analyse von 
Cornelius-White (2007) zugrunde gelegt, die sich insbesondere den personenzen- 
trierten Variablen nach Rogers (1957, 1981) aufseiten der Lehrpersonen widmete. 
Es zeigte sich, dass insbesondere Nondirektivität (r = .35), Empathie (r = .32), 
Warmherzigkeit (r = .32) sowie die Förderung abstrakten Denkens (r = .29) 
im Zusammenhang mit positiven Effekten auf der Lernendenseite stehen. Ein 
empathischer, wertschätzender Umgang mit Lernenden fördert also die kogni- 
tive Entwicklung, die Motivation und das Wohlbefinden. Allerdings wird hier 
nur eine unidirektionale und paradigmatisch eng gefasste Perspektive auf die 
Lehr-Lern-Interaktion betrachtet. 

Die Komplexität der Lehr-Lern-Interaktion schlägt sich in unterschiedlichen 
theoretischen Ansätzen nieder. In der Forschung standen zunächst unidirektionale 
Modelle im Fokus. So gibt es auf der einen Seite Ansätze, die die lernende Per- 
son als Ausgangspunkt der Lehr-Lern-Interaktion annahmen (Neill, 1973, nach 
Thies, 2017; Nohl, 1933, nach Thies, 2017), andere fokussieren die Lehrper- 
son (z. B. Erziehungsstile von Lewin et al., 1939; Erziehungsdimensionen von 
Tausch & Tausch, 1963, nach Thies, 2017). Später entstanden komplexere inter- 
aktionale und transaktionale Modelle, die reine Ursache-Wirkungs-Beziehungen 
infrage stellten (aptitude-treatment interaction von Cronbach & Snow, 1977, nach 
Münzer & Brünken, 2018; transaktionales Modell von Nickel, 1985). Außerdem 
wurden (weitere) Ansätze aus der Erziehungsstilforschung (‚Freiheit in Gren- 
zen“ von Schneewind & Böhmert, 2009a, 2009b, 2009c, bei Kiel et al., 2013), 
der Bindungstheorie, der Selbstbestimmungstheorie (vgl. Knierim et al., 2017) 
und der Psychotherapie (u. a. humanistische Ansätze bei Cornelius-White, 2007; 


! Häufig wird auch der Beziehungsbegriff herangezogen, da aber Beziehung ohne Interaktion 
nicht möglich ist, wird deswegen hier der Interaktionsbegriff genutzt. 
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Tausch, 2017; psychoanalytische Ansätze bei Lühmann, 2019; Schaub, 2013) auf 
die Lehr-Lern-Interaktion übertragen. 

Die Lehr-Lern-Interaktion kann auch aus der Perspektive von Angebots- 
Nutzungs-Modellen (z. B. Helmke, 2017; Reusser & Pauli, 2010), den derzeit 
prominentesten Wirkmodellen der Lehr-Lern-Forschung (Kohler & Wacker, 2013; 
Seidel, 2014), betrachtet werden. Kernaussage dieser Theorien ist, dass Lehre und 
Unterricht ein Angebot darstellen, das nur durch die entsprechende Nutzung zu 
positiven Wirkungen, d. h. zu Kompetenzaufbau und weiteren Entwicklungen (z. 
B. der Persönlichkeit), führen kann. Das Unterrichtsangebot ist kontextgebunden 
und wird sowohl von den Lehrpersonen als auch den Lernenden bereitgestellt. 
Wenngleich es zumeist nicht explizit in den Modellen Erwähnung findet, ist auch 
der Beziehungsaufbau in der Lehre bzw. im Unterricht als Angebot der beteiligten 
Interaktionspartner*innen” anzusehen, das genutzt werden muss. 

Lehre und Unterricht — sowohl in der Schule, der Hochschule als auch in 
der Erwachsenenbildung — sind durch eine asymmetrische Dependenz (Thies, 
2010) sowie höhere Machtmittel aufseiten der Lehrpersonen (Misamer, 2019; 
vgl. Steins, 2014) bestimmt. Dennoch sind Lernende nicht einfach als abhängige 
Variablen zu betrachten, die ausschließlich auf Lehrpersonen reagieren, sondern 
sie sind aktiver Bestandteil in der Gestaltung der Lehr-Lern-Interaktion (vgl. u. 
a. Nickel, 1985; Thies, 2010). 

Die meisten Modelle und Theorien zur Lehr-Lern-Interaktion sind zumeist 
genuin für die schulische und/oder familiäre Interaktion formuliert, können 
aber weitestgehend auch auf den Hochschulbereich und die Erwachsenenbil- 
dung übertragen werden. Erwachsenenbildung lässt sich nur tendenziell vom 
Lernen in der Schule abgrenzen (Siebert, 1996, nach Klein, 2011; vgl. Helmke 
et al., 2008). „Unabhängig vom Alter kann man zur Beschreibung und Erklä- 
rung von Lernprozessen die gleichen wissenschaftlichen Konstrukte heranziehen“ 
(Stern, 2006, nach Klein, 2011, S. 120). Für einen Überblick zur Lehr-Lern- 
Interaktionsforschung sei hier auf die Herausgeberwerke von Schweer (2017; zum 
historischen Abriss s. Thies, 2017) und Herrmann (2019) verwiesen. 


2 In der vorliegenden Arbeit wird das Gendersternchen (*) genutzt, um alle Geschlechtlich- 
keiten zu berücksichtigen (vgl. Diewald & Steinhauer, 2020; Kronschläger, 2020). In den 
empirischen Untersuchungen in den Fragebögen wurde mit Splitting (/) gearbeitet. 
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Erwartungen sind Antizipationen und können an verschiedene Ziele gerichtet wer- 
den (Kapitel 3), z. B. an Situationen, an Gegenstände, aber auch an Personen, 
sowohl auf andere als auch auf sich selbst (Kapitel 4). Personenbezogene Erwar- 
tungen können sich u. a. aus Stereotypen und Vorurteilen ergeben, da sich soziale 
Gruppen vermeintlich in bestimmten Eigenschaften unterscheiden. Das stereo- 
type content model (u. a. Fiske & Taylor, 2017; Fiske et al., 1999; Fiske et al., 
2002) stellt insbesondere die Wärme bzw. Sympathie und die Kompetenz als 
relevante Faktoren für die Beurteilung von Mitgliedern sozialer Gruppen heraus 
(Kapitel 5). 

Der Pygmalion-Effekt wurde im Lehr-Lern-Kontext erstmalig im sogenannten 
Oak School-Experiment von Rosenthal und Jacobson (1966, 1971) untersucht und 
stieß die Forschung zu Kompetenzerwartungen von Lehrpersonen an (Kapitel 6). 
Rosenthal und Jacobson (1966, 1971) manipulierten nach dem Zufallsprinzip die 
Kompetenzerwartungen von Lehrkräften an ihre Schüler*innen, die sich selbst 
erfüllten: Schüler*innen, von denen die Lehrkräfte dachten, sie würden im Laufe 
des Schuljahres besonders viele Kompetenzen und Fähigkeiten aufbauen, schnit- 
ten in einem Test am Ende eines Schuljahres tatsächlich besser ab. Inzwischen ist 
der Pygmalion-Effekt mehrfach überprüft und bestätigt worden (u. a. Jussim & 
Harber, 2005; Ludwig, 2018). Damit der Pygmalion-Effekt wirksam werden 
kann, ist es notwendig, dass Lernende das Verhalten der Lehrperson hinneh- 
men und diesem keinen Widerstand entgegensetzen (Brophy & Good, 1976; 
Tauber, 1997). Erwartungen sind auch im Fokus von Theorien der Lehr-Lern- 
Interaktion, z. B. im transaktionalen Modell von Nickel (1985), das sich explizit 
auf den Pygmalion-Effekt beruft (Kapitel 7), sowie im Interaktionsregulationsmo- 
dell von Rosemann (1978), der insbesondere normative Erwartungen betrachtet 
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(Kapitel 8). Viele Kompetenzerwartungen von Lehrpersonen sind in natürli- 
chen Lehr-Lenr-Situationen aufgrund von verschiedenen Stereotypen verzerrt 
(Kapitel 9). 

Weitergehend können auch Lernende Erwartungen an Lehrpersonen haben 
(Feldman & Prohaska, 1979; Kapitel 10). Diese speisen sich u. a. auch aus 
den Gruppenzugehörigkeiten der Lehrkräfte (z. B. Geschlechtsstereotype), durch 
Informationen von Geschwistern bzw. Freund*innen oder durch öffentliche Lehr- 
bewertungen im Internet (z. B. in Deutschland spickmich.de im Zeitraum von 
2007 bis 2014 oder in den USA RateMyTeachers.com und RateMyProfes- 
sors.com). Die Lernendenerwartungen (Kapitel 11) an Lehrpersonen beeinflussen 
das Erleben und Verhalten der Lernenden, darunter auch die Leistung. Die Frage 
nach der Wirkung von Lernendenkompetenzerwartungen auf Lehrpersonen steht 
jedoch selten im Fokus. Bis heute sind in der englisch- und deutschsprachigen 
Literatur nur zwei Studien zu finden, die die Auswirkungen auf die Lehrper- 
sonen erfassten (Feldman & Prohaska, 1979; Feldman & Theiss, 1982), die 
auch zu unterschiedlichen Befunden kamen: Bei Feldman und Prohaska (1979) 
konnte sich ein Einfluss der Lernendenkompetenzerwartungen auf die Lehrperso- 
nen mediiert über das Verhalten zeigen, bei Feldman und Theiss (1982) blieb ein 
Effekt aus. 

Die vorliegende Arbeit widmet sich empirisch Lernendenkompetenzerwartun- 
gen an Lehrpersonen, einem vernachlässigten Aspekt in der Lehr-Lern-Interaktion 
(Kapitel 12). In zwei experimentellen Studien werden stereotypbasierte Erwar- 
tungsverzerrungen auf Basis von Geschlecht betrachtet (Kapitel 13 und Kapi- 
tel 14). Anschließend wird das Verhalten von Lernenden in Abhängigkeit ihrer 
Kompetenzerwartungen an Lehrpersonen experimentell untersucht (Kapitel 15). 
Eine vierte Studie fokussiert Korrelate von Lernendenkompetenzerwartungen im 
Erleben von Lehre bei sowohl Lernenden als auch Lehrpersonen in einer Feldun- 
tersuchung (Kapitel 16). Im Anschluss an die Präsentation der vier empirischen 
Untersuchungen werden die Ergebnisse im Gesamten in Bezug auf theoretische 
Verortung (Kapitel 17), Limitationen und Stärken (Kapitel 18) sowie praktische 
und theoretische Ableitungen diskutiert (Kapitel 19). 
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Erwartungen und Erwartungseffekte 3 


Erwartungen werden im allgemeinen Sprachgebrauch als eine vorausschauende 
Vermutung, Annahme oder Hoffnung beschrieben (Duden, o. J.). Unter Erwartun- 
gen in (motivations-)psychologischen Theorien wird ,,[...] die wahrgenommene 
Chance, dass sich aus einer Situation ein bestimmter Zielzustand ergibt“ (Heck- 
hausen & Heckhausen, 2018, S. 122) verstanden. Allgemeiner formuliert es 
Rudolph (2009, S. 21): „Eine Erwartung ist die subjektive Vorwegnahme eines 
Ereignisses [...].“ 


Der Begriff „Erwartung“ wird im Zusammenhang mit dem Erwartungseffekt im 
deskriptiven Sinne verstanden, d. h. als mentale Antizipation zukünftiger Ereignisse, 
von deren Eintreffen der Erwartende überzeugt ist. Neben dieser Wortbedeutung wird 
„Erwartung“ (expectancy) [...] auch im übertragenen, normativen Sinn gebraucht, 
d. h. zur Äußerung eines Wunsches, einer Forderung oder einer Norm. Wenn aus 
Perspektive des Erwartungseffekts hohe Leistungserwartungen als wünschenswert 
angesehen werden, sind also nicht hohe Leistungsforderungen gemeint [...]. (Ludwig, 
2018, 5. 142) 


Erwartungen sind durch kognitive Prozesse determiniert (u. a. Thompson & 
Sufol, 1995) und sie sind eine subjektive Größe, die sich durch den soziokul- 
turellen Bezugsrahmen und die Lerngeschichte der einzelnen Person ergeben 
(Heckhausen & Heckhausen, 2018; Nickel, 1985). Michael et al. (2012) beschrei- 
ben, dass, obwohl Erwartungen auf viele Arten entstehen können, sie oft das 
Ergebnis von Suggestionen sind, die von anderen Menschen oder von der Umwelt 
kommen. Wichtig ist, dass Erwartungen explizierbar sein können oder aber 
unbewusst das eigene Verhalten und Denken steuern (Michael et al., 2012). 

Der Erwartungseffekt steht für „[...] einen hochspezifischen Einfluss von Anti- 
zipationen auf das Antizipierte“ (Ludwig, 2018, S. 141) und beschreibt das 
Eintreten der eigenen Erwartung. Neben dem Begriff des Erwartungseffekts, der 
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in der vorliegenden Arbeit genutzt wird, wird auch die Bezeichnung ,,(sich) 
selbsterfüllende Prophezeiung“ (self-fulfilling prophecy) im Lehr-Lern-Kontext 
synonym genutzt (vgl. Ludwig, 2018; Tauber, 1997). Wenn ein bestimmtes 
Ereignis erwartet wird, setzt sich automatisch eine Kette aus Kognitionen und 
Verhalten in Gang, um dieses Ereignis auszulösen, und Ursachen dafür werden 
fehlattribuiert (vgl. Geis, 1993; Michael et al., 2012). Erwartungseffekte lassen 
sich demnach mit zwei unterschiedlichen Phänomenen beschreiben (vgl. u. a. 
Greitemeyer, 2020): 


1. Fehlinterpretation der Wahrnehmung: Ankommende Informationen werden 
konform mit den eigenen Erwartungen aufgenommen, verarbeitet und behal- 
ten. 

2. Ausrichtung des eigenen Verhaltens, was eine Beeinflussung des Verhaltens 
anderer in erwartungskongruente Richtung nach sich zieht. 


Häufig wird der Erwartungseffekt ausschließlich für bisher nicht eingetroffene 
bzw. nicht zutreffende Erwartungen genutzt (z. B. Jussim & Harber, 2005; 
Lorenz, 2019), d. h., es liegen noch keine tatsächlichen (bzw. „objektiven“) Infor- 
mationen zur erwarteten Eigenschaft vor. Jedoch können Erwartungseffekte auch 
weiter gefasst werden: Ein Kind, das bisher gute schulische Leistung erzielte, 
wird dadurch höhere Kompetenzerwartungen bei den Lehrkräften auslösen, die 
wiederum die Interaktion beeinflussen können. „Eine solche Variante der sich 
selbst erfüllenden Prophezeiung wird als self-maintaining prophecy [(sich) selbst 
erhaltende Prophezeiung] bezeichnet: Sie führt zur Beibehaltung eines Leistungs- 
standards bzw. vergrößert die ohnehin schon vorhandenen Leistungsunterschiede 
zwischen Schülern“ (Ludwig, 2018, S. 142). 

Obwohl die Auswirkungen von Erwartungen sehr stark sein können, ergeben 
sie sich nicht immer. In einigen Fällen können sie sich sogar umkehren, bei- 
spielsweise wenn eine Erwartung im Konflikt mit der bisherigen Erfahrung steht 
(Michael et al., 2012). Erlebt eine Lehrkraft beispielsweise über Jahre hinweg 
eine bestimmte Schülerin im Unterricht als besonders engagiert und fähig, kann 
die Aussage und Erwartungsinduktion von vermeintlichen Expert*innen, dass 
diese Schülerin sich in der Zukunft verschlechtern wird, dazu führen, dass die 
Erwartung nicht selbsterfüllend wird, sondern dass die Lehrkraft diese Schülerin 
besonders unterstützt. Dies kann eine Erklärung dafür sein, dass die Erwar- 
tungsmanipulationen, die von Rosenthal und Jacobson (1966, 1971) durchgeführt 
wurden, nur in den Klassenstufen 1 und 2 einen Einfluss auf die Lehr-Lern- 
Interaktion und somit auf die Leistung der Lernenden hatten und in den höheren 
Klassenstufen nicht (s. Kapitel 6). 
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Für interpersonale Kompetenzerwartungseffekte innerhalb des Lehr-Lern- 
Kontexts hat sich die Bezeichnung Pygmalion-Effekt von Rosenthal und Jacobson 
(1971) durchgesetzt (Ludwig, 2018). Neben dem Pygmalion-Effekt (s. Kapitel 6) 
gibt es noch eine Reihe von weiteren Erwartungseffekten sowie Differenzierun- 
gen. 
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Es können drei unterschiedliche Klassen von Erwartungseffekten unterschieden 
werden: (1.) selbstbezogene Erwartungseffekte, (2.) fremdbezogene Erwartungs- 
effekte und (3.) Erwartungs-Erwartungseffekte (s. Tabelle 4.1). Für diese Klassi- 
fikation wurde die ursächliche Erwartung für eine selbsterfüllende Prophezeiung 
herangezogen, im Prozess können aber weitere Erwartungseffekte relevant sein 
(Beispiel Pygmalion-Effekt s. Kapitel 6). In „natürlichen“ Situationen, also außer- 
halb von experimentellen Untersuchungen, sind somit die Effekte nicht immer 
eindeutig zu unterscheiden und können je nach Interpunktion (vgl. Watzlawick 
et al., 2017) unterschiedlich interpretiert werden. Die drei Klassen sollen im 
Folgenden überblicksartig kurz mit den zugeordneten Effekten skizziert werden. 


Tabelle 4.1 Klassifikation von Erwartungseffekten 


Selbstbezogene Fremdbezogene Erwartungs- 

Erwartungseffekte Erwartungseffekte Erwartungseffekte 

e Placebo-Effekt e Versuchsleitungs- e Andorra-Effekt 

e Nocebo-Effekt Erwartungseffekt e Versuchsteilnehmende- 

• Selbstwirksamkeits- • Pygmalion-Effekt Erwartungseffekte 
erwartungen • Galatea-Effekt 


• Golem-Effekt 
• Jastrow-Effekt 
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4.1 Selbstbezogene Erwartungseffekte 


Selbstbezogene Erwartungseffekte beziehen sich auf Erwartungen, die auf sich 
selbst und die eigenen Reaktionen gerichtet sind. Hierzu zählen der Placebo- und 
der Nocebo-Effekt, aber auch die Effekte von Selbstwirksamkeitserwartungen. 

Ein Placebo ist ein Medikament ohne Wirkstoffe. Bei vielen Medikamen- 
tenstudien erreicht ein Placebo ähnliche Wirkungen wie ein Medikament mit 
Wirkstoffen, wenn den Patient*innen suggeriert wird, der Placebo habe eine Wir- 
kung (vgl. Hansen et al., 2017; Hoefert, 2010). Durch die positiven Erwartungen 
an ein Medikament kann die heilende Wirkung verstärkt bzw. bei einem Pla- 
cebo überhaupt erst angeregt werden. Dieses Phänomen wird als Placebo-Effekt 
bezeichnet und geht über Medikamente hinaus. So sind Placebo-Effekte auch bei 
u. a. psychotherapeutischen Maßnahmen beobachtbar (Lambert & Kleinstäuber, 
2016; Locher et al., 2016). Der Nocebo-Effekt hingegen beschreibt die Zunahme 
von erwarteten Nebenwirkungen durch medizinische und therapeutische, insbe- 
sondere medikamentöse, Behandlungen (vgl. Hansen et al., 2017; Hoefert, 2010). 
Placebo-Effekte, aber auch Nocebo-Effekte in der Medizin finden sich empirisch 
abgesichert für verschiedene Bereiche (u. a. Fibromyalgie, Chen et al., 2017; 
neuropathischer Schmerz, Cragg et al., 2016; Morbus Meniére, Dimitriadis & 
Panagiotis, 2017; chronisch-entzündliche Darmerkrankungen, Ma et al., 2019; 
Osteoarthritis, Zhang et al., 2008). Auch die implizite Lernleistung kann durch 
Placebo- und Nocebo-Effekte beeinflusst sein. In einem Experiment von Colagi- 
uri et al. (2011) sollten Proband*innen an einem Wattepad riechen. Eine Gruppe 
erhielt die Information, dass das Riechen die kognitive Leistung steigert (Placebo- 
Gruppe), bei der zweiten Gruppe wurde behauptet, das Riechen reduziert die 
kognitive Leistung (Nocebo-Gruppe), und einer dritten Gruppe wurde keine Infor- 
mation zum Riechen gegeben. Es zeigte sich, dass die Placebo-Gruppe am besten 
ein Muster in Aufgabenlösungen unbewusst lernte (implizites Lernen) und die 
Nocebo-Gruppe am schlechtesten. Kirsch (1985) beschreibt drei Prozesse für den 
Placebo- und den Nocebo-Effekt in seiner response expectancy theory. Bei den 
Effekten handelt es sich um Erwartungen an die eigene Reaktion. Diese Erwartun- 
gen führen direkt zu (1) einer erwartungskonformen Wahrnehmung der eigenen 
Reaktion, (2) teilweise zu einer Änderung physiologischer Korrelate und (3) zu 
einer erwartungskonformen Anpassung des Verhaltens. 

Eine weitere Form der selbstbezogenen Erwartungen ist die Selbstwirksam- 
keitserwartung. Diese wird bestimmt als die Überzeugung bzw. Erwartung, 
ein Verhalten mit Erfolg ausführen zu können, das benötigt wird, um ein 
Ziel oder ein gewünschtes Ergebnis zu erreichen (Bandura, 1977a, 1977b). 
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Selbstwirksamkeitserwartungen werden seltener im Kontext von Erwartungsef- 
fekten diskutiert, können jedoch auch wie ein Placebo wirken (vgl. Eden & 
Zuk, 1995). So ist es möglich, dass Personen, die hohe Selbstwirksamkeitser- 
wartungen haben, bei Aufgaben mehr Ressourcen investieren, um erfolgreich 
zu sein, als Personen mit vergleichbaren Leistungspotenzial, die aber geringe 
Selbstwirksamkeitserwartungen haben, und dadurch auch mehr Erfolge erzielen. 
Dies kann aus meta-analytischen Ergebnissen abgelesen werden: Selbstwirksam- 
keitserwartungen stehen im Zusammenhang mit Persistenz (als ein Marker fiir 
den Ressourceneinsatz; r = .38, Multon et al., 1991), akademischer Leistung 
(r = .38, Multon et al., 1991) und Arbeitsleistung (r = .38, Stajkovic & Luthans, 
1998). 


4.2 Fremdbezogene Erwartungseffekte 


Fremdbezogene Erwartungseffekte beziehen sich auf Erwartungen gegenüber 
anderen Personen (interpersonale Erwartungen) oder Objekten (objektbezogene 
Erwartungen; z. B. Computer-Lernprogramme). Hierzu gehören der Pygmalion- 
Effekt, der Versuchsleitungs-Erwartungseffekt und der Jastrow-Effekt. 

Mit dem Versuchsleitungs-Erwartungseffekt (experimenter expectancy bias) 
wird der Einfluss des Wissens über die Hypothesen — also die Erwartungen — 
der Versuchsleitung in experimentellen Studien beschrieben. Es handelt sich um 
eine (unbewusste) Beeinflussung der Proband*innen bzw. der Versuchsobjekte zur 
Unterstützung der Hypothesen (Rosenthal & Fode, 1973; vgl. Klein et al., 2012) 
bzw. eine zugunsten der Hypothesen verzerrte Beobachtung und Auswertung 
(Beobachtungseffekte). Für eine detaillierte Darstellung sei hier auf Rosenthal 
(1966, 2009) verwiesen. 

Der Pygmalion-Effekt beschreibt die selbsterfüllende Prophezeiung von Leh- 
rendenerwartungen an Lernende (Rosenthal & Jacobson, 1966, 1971), kann aber 
auch darüber hinaus auf andere Kontexte Anwendung finden. Hat beispielsweise 
eine Lehrperson eine hohe Kompetenzerwartung an eine lernende Person, wird 
die lernende Person mehr Wissen generieren bzw. Fähigkeiten aufbauen. Dies 
wird über das Verhalten der Lehrperson vermittelt, die sich aufgrund ihrer Erwar- 
tungen emotional unterstützender verhält und fordernderes Arbeitsmaterial zur 
Verfügung stellt (detaillierte Beschreibung des Pygmalion-Effekts s. Kapitel 6). 
Der Pygmalion-Effekt lässt sich unterteilen in den Galatea- und den Golem-Effekt 
(Babad et al., 1982). Der Galatea-Effekt beschreibt die selbsterfüllenden Auswir- 
kungen einer positiven Erwartung (2. B. eine lernende Person ist fleißig), während 
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der Golem-Effekt die selbsterfüllenden Auswirkungen einer negativen Erwartung 
(z. B. eine lernende Person ist unfähig) beschreibt. 

Begrifflich geht der Galatea-Effekt auf die Pygmalion-Mythologie zurück: 
Der Künstler Pygmalion erschuf die Statue einer Frau, in der seine ästhe- 
tischen Erwartungen vollends aufgingen, und verliebte sich in sie. Er bat 
Venus/Aphrodite, die Göttin der Liebe, um eine Frau, die so ist wie seine Statue 
aus Elfenbein. Die Göttin antwortete, indem sie die Statue zum Leben erweckte. 
Dieser Mythos beschreibt, wie die (unbewussten) Erwartungen von Pygmalion 
die Statue einer für ihn perfekten Frau entstehen ließen. Der Name der Sta- 
tue, an die die Erwartungen von Pygmalion gerichtet wurden, ist Galatea (Ovid, 
2003, Original von — 1/10). Dieser Mythos ist in seiner Grundlogik von Rosen- 
thal und Jacobson (1971) auf die Lehr-Lern-Interaktion übertragen worden, um 
die Relevanz von Erwartungseffekten (vgl. Ludwig, 2018) zu beschreiben. Der 
Golem-Effekt hingegen bezieht sich auf jüdische Legenden eines Golems, eines 
aus Ton geformten Wesens (vgl. Grözinger, 2009). Der Golem wurde ursprüng- 
lich zum Schutz der jüdischen Bevölkerung erschaffen, der mit der Zeit jedoch 
immer gewalttätiger wurde und sich gegen Menschen wendete, sodass er zerstört 
werden musste. Die negativen Auswirkungen von selbsterfüllenden Prophezeiun- 
gen wurden deswegen von Babad et al. (1982) als Golem-Effekt beschrieben. 
Pygmalion ist also mythologisch eine Figur, die (unbewusst) eine Erwartung hat, 
während Galatea und der Golem Figuren sind, an die (mehr oder weniger) eine 
Erwartung gerichtet wird. 

In der Lehr-Lern-Interaktion zeigten sich sowohl Galatea- als auch Golem- 
Effekte. So schnitten beispielsweise bei Reynolds (2007) Studierende mit ähn- 
lichen Ausgangsvoraussetzungen in einem Management-Kurs signifikant besser 
ab, wenn die dozierende Person dachte, die Gruppe hätte gute Leistungen 
(Galatea-Bedingung), im Vergleich zu einer Kontrollgruppe und zu Studierenden 
in einer Golem-Bedingung. Weitergehend schnitten die Studierenden der Golem- 
Bedingung schlechter ab als die Kontrollgruppe. Kritisch bei Reynolds (2007) 
anzumerken ist jedoch, dass es nur drei Dozierende gab (also eine dozierende 
Person je Bedingung), sodass der Effekt u. U. auch im Stil der Dozierenden unab- 
hängig der Erwartungsinduktion begründet sein kann. (Kompetenz-)Erwartungen 
können aber auch bei Lernenden bestehen oder sich auf Objekte beziehen. Dies 
zeigte sich beispielsweise beim Lernen mit Computerprogrammen: Studierende, 
die ein qualitativ hochwertiges Lernprogramm erwarteten (Galatea-Bedingung), 
lernten mehr als Studierende, die ein Programm mit einer nicht eindeutigen Qua- 
lität (Golem-Bedingung) erwarteten. Studierende, die keine Erwartungen an das 
Lernprogramm hatten, schnitten mit einem Testwert zwischen den beiden anderen 
Gruppen ab (Fries et al., 2006; vgl. Haimerl & Fries, 2010). 
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Der Jastrow-Effekt beschreibt den Effekt, sich an aufgabenbezogenen 
Ergebnis-Erwartungen mit einem Werkzeug (im weiten Sinne) zu orientieren 
(Jastrow, 1901; vgl. Olshansky, 2007; Rosenthal & Jacobson, 1971). Wird eine 
maximale Obergrenze an Leistung mit einem bestimmten Werkzeug erwartet, 
wird sich an dieser Grenze orientiert. Dies beschrieb Jastrow (1901) am Bei- 
spiel der Hollorith-Tabelliermaschine: Im Jahr 1890 wurde die Maschine im 
Zensus-Amt der USA eingefiihrt. Es wurde einer ersten Gruppe von Arbeiten- 
den beschrieben, dass mit der Maschine pro Tag etwa 550 Karten gelocht werden 
sollten. Nach zwei Wochen konnten einige Arbeitende 500 bis 550 Karten lochen, 
später mit öffentlichen Rekordlisten einige sogar bis zu 1500. Die höheren Leis- 
tungen gingen gleichzeitig mit hohem Anstrengungserleben einher. Einer zweiten 
Gruppe von Arbeitenden wurde keine Zahl von zu bearbeitenden Karten pro Tag 
genannt. Einige Arbeitende dieser zweiten Gruppen waren bereits nach drei Tagen 
in der Lage, 500 Karten zu bearbeiten — nach einer Woche konnten dies fast 
alle. Später waren Leistungen bis zu 2230 Karten möglich. Die Arbeitenden der 
zweiten Gruppe litten jedoch nicht so wie die Arbeitenden der ersten Gruppe 
an Uberbelastung. Die Erwartung an die zu leistende Aufgabe hat das Verhalten 
und die Reaktion auf die Aufgabenerledigung bestimmt. Der Jastrow-Effekt wird 
hier den fremdbezogenen Erwartungseffekten zugeordnet, weil die Erwartungen 
sich auf die Möglichkeiten im Umgang mit einem Werkzeug bzw. einer Maschine 
(z. B. die Hollorith-Tabelliermaschine) beziehen. So schreibt Jastrow (1901), dass 
davon ausgegangen wurde, dass die Bedienung der Hollorith-Tabelliermaschinen 
ein hohes Maß an Intelligenz benötigt. Wird allerdings ein Leistungspotenzial von 
Mitarbeitenden erwartet, ist dies analog zum Pygmalion-Effekt. Sollten Mitarbei- 
tende jedoch bestimmte Leistungen erbringen, weil sie glauben, diese erbringen 
zu müssen, liegen Erwartungs-Erwartungen vor. 


4.3 Erwartungs-Erwartungseffekte 


Erwartungs-Erwartungseffekte beziehen sich auf angenommene Erwartungen 
anderer bezüglich der eigenen Person (vgl. antizipierte Fremdwahrnehmung, 
Thies, 2010). Hierzu zählt der Andorra-Effekt. Der Andorra-Effekt „[...] bezeich- 
net die Erscheinung, dass sich Menschen jenem Vorstellungsbild anpassen, das 
ihre Mitmenschen von ihnen haben. Wer für vertrauenswürdig gehalten wird, 
versucht das in ihn gesetzte Vertrauen zu rechtfertigen und ist selbst vertrauens- 
fähig und vertrauensbereit“ (Nitsch 1975, zit. nach Lies et al., 2015, S. 171). 
Der Begriff Andorra-Effekt geht auf das Drama von Max Frisch (1999; urauf- 
geführt 1961) zurück, in dem der Protagonist als Jude ausgegeben und dadurch 
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negativen Stereotypen ausgesetzt ist. Mit der Zeit übernimmt er die negativen 
Verhaltensweisen, die ihm als Jude unterstellt werden, und wird später ermor- 
det. Der Andorra-Effekt kann so erklärt werden, dass das vermittelte „Bild“ 
von außen in ein inneres Selbstbild integriert wird, das als Schema das eigene 
Verhalten (situationsspezifisch) beeinflusst (u. a. Froming et al., 1998; Paw- 
lik & Buse, 1979). Parallelen für den Einfluss des Selbstbilds finden sich bei 
Sternzeichen. Es wird häufig diskutiert, ob Sternzeichen die Persönlichkeit von 
Menschen determinieren (vgl. Burke, 2012; Laux, 2008). Zumeist werden keine 
Zusammenhänge festgestellt und Befunde, die Unterschiede ausmachen, als Arte- 
fakte beschrieben (Hartmann et al., 2006; Wunder, 2003). Bei Pawlik und Buse 
(1979; Laux, 2008) zeigten sich hingegen bei Proband*innen, die an den Ein- 
fluss von Sternzeichen glaubten, Zusammenhänge zwischen Sternzeichen und 
Persönlichkeitseigenschaften. Der Glaube an Sternzeichen und Astrologie scheint 
moderierend zu wirken: Pawlik und Buse (1979; vgl. Laux, 2008) erklärten ihren 
Befund dadurch, dass die glaubenden Proband*innen das Wissen über Sternzei- 
chen internalisiert hatten und dadurch ein (implizites) Selbstkonzept aufbauten, 
an das sich die Proband*innen anpassten. Fraglich bleibt, ob sich tatsächlich 
die Persönlichkeit dadurch verändert oder lediglich das Antwortverhalten (Laux, 
2008). 

Im Kontext der Erwartungseffekte werden z. B. auch der Hawthorne- und der 
John-Henry-Effekt erwähnt. Der Hawthorne-Effekt beschreibt die Veränderung 
des Verhaltens auf Basis einer Beobachtung bzw. einer Teilnahme an einer Studie 
(u. a. Wickström & Bendix, 2000) und der John-Henry-Effekt die Veränderung 
des Verhaltens (z. B. besondere Anstrengung) aufgrund der Annahme, zu einer 
Kontrollgruppe in einer experimentellen Studie zu gehören (u. a. Saretsky, 1972; 
auch kompensatorischer Wettstreit genannt, Döring & Bortz, 2016). Beide Effekte 
sind jedoch keine Erwartungseffekte im Sinne einer selbsterfüllenden Prophezei- 
ung. Wenn Versuchsteilnehmende jedoch die Hypothesen, die überprüft werden 
sollen, kennen oder erahnen und sich diesen (bewusst oder unbewusst) anpassen, 
liegt ein Erwartungs-Erwartungseffekt vor (vgl. Döring & Bortz, 2016). 

In dieser Arbeit sollen fremdbezogene, interpersonale Erwartungseffekte, die 
sich auf die Kompetenz anderer Personen beziehen, fokussiert werden. Kom- 
petenzerwartungen können aus unterschiedlichen Quellen stammen: Mitteilung 
durch Dritte, öffentliche Bewertungen und Gerüchte, aber auch wesentlich durch 
Stereotype. 
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Stereotypbasierte Erwartungen und 
das stereotype content model 


[The] real environment is altogether too big, too complex, and too fleeting, for direct 
acquaintance. We are not equipped to deal with so much subtlety, so much variety, so 
many permutations and combinations... We have to reconstruct it on a simpler model 
before we can manage with it. (Lippmann, 1922, nach Gilovich et al., 2006, S. 451) 


Um die Komplexität der Welt zu reduzieren, greifen Menschen auf Schemata 
zurück. Ein Schema ist eine kognitive Repräsentation, die auf Kategorien aufbaut 
und vorverarbeitetes Wissen einer Person über Objekte, Personen oder Handlun- 
gen enthält (u. a. Fiske & Taylor, 2017; Gilovich et al., 2006; Pendry, 2014; 
Werth, Denzler & Mayer, 2020). Kategoriebasierte Verarbeitung ist im Vergleich 
zur individuierenden Verarbeitung weniger aufwendig, weniger anstrengend und 
schont kognitive Ressourcen (u. a. Fiske & Taylor, 2017; Klauer, 2020). 

Stereotype sind Schemata, die sich auf soziale Gruppen und Mitglieder dieser 
Gruppen beziehen, und Resultat sozialer Kategorisierung (Fiske & Taylor, 2017; 
Greitemeyer, 2012; Klauer, 2020; Pendry, 2014; Werth, Denzler & Mayer, 2020). 
Grundlage für eine soziale Kategorisierung können verschiedene Merkmale wie 
Äußerliches (z. B. Hautfarbe, Geschlecht), Überzeugungen (z. B. Politik, Reli- 
gion), Krankheiten oder Beeinträchtigungen (z. B. körperliche Behinderung, HIV) 
oder auch Verhalten (z. B. Kriminalität, Sexualität) sein (vgl. Klauer, 2020; 
Tröster & Pulz, 2020). Zu den bedeutsamsten Kategorien gehören die (zumeist 
sichtbaren) Merkmale Geschlecht, Ethnie und Alter, die auch als automatische 
bzw. primitive Kategorien bezeichnet werden (Fiske & Neuberg, 1990; Krings & 
Kluge, 2020). 

Stangor (2009, S. 2) definiert Stereotype wie folgt und grenzt sie von 
Vorurteilen ab: 
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We now define prejudice as a negative attitude toward a group or toward members of 
the group. Defining stereotyping has been more problematic—there are tens, if not 
hundreds of definitions in the literature, although they are mostly based on the gene- 
ral idea of stereotypes as knowledge structures that serve as mental “pictures” of the 
groups in question (Lippmann, 1922). With some exceptions, I’d say that we gene- 
rally agree that stereotypes represent the traits that we view as characteristic of social 
groups, or of individual members of those groups, and particularly those that diffe- 
rentiate groups from each other. In short, they are the traits that come to mind quickly 
when we think about the groups. 


Stereotype gehen also über die bloße Kategorisierung hinaus und beinhalten die 
Eigenschaften und die Erwartungen, die mit bestimmten sozialen Gruppen ver- 
knüpft sind (u. a. Klauer, 2020; Pendry, 2014; Werth, Denzler & Mayer, 2020). 
Dabei wird die Zugehörigkeit zu einer Gruppe herangezogen, um über ein Indivi- 
duum ein Gesamturteil auf Basis eines Stereotyps zu erstellen (vgl. Halo-Effekt; 
vgl. Werth, Seibt & Mayer, 2020; Wolfrath, 2020) — unabhängig von der Kor- 
rektheit der spezifischen Kategorisierung. Stereotype stehen in Verbindung mit 
Vorurteilen und Diskriminierung. Dabei bezeichnen Stereotype eine kognitive 
Struktur, Vorurteile eine affektive und evaluative Struktur (in Kombination mit der 
kognitiven Struktur; Werth, Seibt & Mayer, 2020) sowie Diskriminierung einen 
konativen und verhaltensbezogenen Prozess (Gilovich et al., 2006; Kessler & 
Mummendey, 2007; Zanna & Rempel, 1988, nach Haddock & Maio, 2014). 

Stereotype sind aufgrund unterschiedlicher Sozialisationsziele sowie -einflüsse 
(z. B. Medien) kulturspezifisch (Asbrock, 2010; Cuddy et al., 2009) und die 
Weitergabe von Stereotypen vollzieht sich durch Sozialisations- und Erzie- 
hungsprozesse (u. a. Cuddy et al., 2008). So zeigten sich Zusammenhänge in 
den Einstellungen von Kindern und ihren Eltern gegenüber Immigrant*innen 
und ethnischen Minderheiten (Rodrigez-Garcia & Wagner, 2009) sowie für 
geschlechtsbezogene Stereotype (Tenenbaum & Leaper, 2002). Meta-analytisch 
ergab sich bei Degner und Dalege (2013) ein positiver Zusammenhang von 
Einstellungen gegenüber Fremdgruppen bei über 45000 Eltern-Kind-Paaren 
(r = .29). Die Entwicklung und der Aufbau von Stereotypen sind multikausal und 
können sowohl mit lerntheoretischen, (sozial-)kognitiven als auch motivationalen 
Ansätzen erklärt werden (Beelmann & Neudecker, 2020; Raabe & Beelmann, 
2009). Stereotype werden aufgrund einer Reihe kognitiver Verzerrungen aufrecht- 
erhalten, die durch die limitierte Informationsverarbeitungskapazität entstehen 
(vgl. u. a. Fiske & Taylor, 2017; Gilovich et al., 2006; Petersen & Six, 2020; 
Spears & Tausch, 2014; Werth, Seibt & Mayer, 2020). 

Das stereotype content model (u. a. Fiske & Taylor, 2017; Fiske et al., 1999; 
Fiske et al., 2002) macht Aussagen darüber, anhand welcher Kriterien soziale 
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Gruppen kategorisiert werden — und damit auch, welche Erwartungen an sie 
bestehen. Das Modell besagt, dass zwei Dimensionen von Bedeutung bei der 
Beurteilung von Stereotypen sind: Die Kompetenzwahrnehmung und die Wär- 
mewahrnehmung, wobei die Wärmewahrnehmung der Kompetenzwahrnehmung 
im Modell theoretisch vorgelagert ist: Zuerst werden Menschen bzw. soziale 
Gruppen danach kategorisiert, ob sie kompetitiv und feindselig (= kalt) oder 
kooperierend und wohlwollend (= warm; Wärme in Anlehnung an den englischen 
Begriff warmth für Herzlichkeit/Freundlichkeit) sind. In einem zweiten Schritt 
wird der Status (= Kompetenz) beurteilt, d. h., ob sie in der Lage sind, kompetitiv 
zu handeln, oder potenziell eine Bedrohung sind. Dabei bewirkt die Kategorisie- 
rung, auf welche Weise gegenüber Personen bestimmter sozialer Gruppen reagiert 
wird (s. Tabelle 5.1). Sozial angesehene Menschen und Gruppen werden als warm 
(u. a. tolerant, warmherzig, ehrlich) und kompetent (u. a. unabhängig, intelligent, 
fähig) wahrgenommen. 


Tabelle 5.1 Gruppenkategorien nach dem stereotype contentmodel (nach Fiske et al., 2002) 


Kompetenz 

Wärme Gering Hoch 

Hoch Paternalistisches Vorurteil, z. B. älteren Bewunderung, z. B. bei Mitgliedern der 
Menschen sowie „Hausfrauen“ Eigengruppe und engen Verbündeten: 
zugeschrieben: Mitglieder haben einen hohen Status 
Mitglieder der Gruppen haben einen und sind nicht kompetitiv. Sie lösen 
geringen Status und sind nicht Stolz und/oder Bewunderung aus. 


kompetitiv. Sie lösen Mitleid und 
Mitgefühl aus. 


Gering Verachtendes Vorurteil, z. B. armen Neidisches Vorurteil, z. B. Asiat*innen, 
Menschen sowie Jüd*innen und Feminist*innen 
Sozialleistungsempfangenden zugeschrieben: 
zugeschrieben: Mitglieder haben einen hohen Status 
Mitglieder haben einen geringen Status und sind kompetitiv. Sie lösen Neid 
und sind kompetitiv. Sie lösen und Missgunst aus. 


Verachtung, Ekel und/oder Wut aus. 


Anmerkungen. Die Kategorisierung der Gruppen entspricht der stereotypen Zuschreibung, 
die nicht die Realität beschreibt. 


Das zum stereotype content model analoge ABC-Modell der Stereotype 
(Koch et al., 2016) geht von drei Dimensionen aus: agency, belief system 
und communion. Das Modell postuliert ein zweidimensionales Muster, in das 
sich soziale Gruppen einordnen lassen. Diese beiden Dimensionen sind agency 
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(sozioökonomischer Erfolg) und belief system (Konservativität vs. Progressivität). 
Personengruppen, die durchschnittlich auf den beiden genannten Dimensionen 
abschneiden, bekommen hohe Werte bei communion (Gemeinschaftssinn). Dabei 
gibt es Parallelen zwischen agency im ABC-Modell und Kompetenz im stereotype 
content model sowie zwischen communion und Warme. 

Es bleibt festzuhalten, dass Stereotype neben den Eigenschaftszuschreibungen 
immer zeitgleich auch Erwartungen an Mitglieder von sozialen Gruppen bereit- 
stellen. Diese sind in der Lehr-Lern-Interaktion besonders bedeutsam, wenn sich 
das Halten von Stereotypen in ungleichen Chancen und Lerngelegenheiten fiir 
Lernende auswirkt. 


Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 Inter- 
national Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche 
die Nutzung, Vervielfaltigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem 
Medium und Format erlaubt, sofern Sie den/die urspriinglichen Autor(en) und die Quelle 
ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, 
ob Änderungen vorgenommen wurden. 

Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen eben- 
falls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts 
anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Com- 
mons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt 
ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des 
jeweiligen Rechteinhabers einzuholen. 


Teil 111 


ERWARTUNGEN IN DER 
LEHR-LERN-INTERAKTION 


® 


Check for 
updates 


Der Pygmalion-Effekt 6 


Der bereits erwähnte und kurz beschriebene Pygmalion-Effekt und damit die 
selbsterfiillenden Prophezeiungen im Lehr-Lern-Kontext wurden durch das Oak 
School-Experiment von Rosenthal und Jacobson (1966, 1971) bekannt und 
berühmt. Die sogenannte Oak School stand in einer größeren Stadt und die 
meisten Schüler*innen stammten aus der „unteren Klasse“, wobei niemand aus 
besonders prekären Verhältnissen stammte. Im Mai 1964 wurden im Rahmen 
einer Studie der „Harvard National Science Foundation“ mehr als 500 Kinder 
in Kindergartenklassen bis zur Klassenstufe 5 mit dem test of general ability 
(TOGA; bestehend aus einem Reasoning- und einem verbalen Subtest) über- 
prüft (Vortest). Am Ende des Sommers 1964, vor Schuljahresbeginn, erhielten 
die Lehrkräfte eine Rückmeldung, welche Kinder ihrer Klasse auf Basis des Vor- 
tests intellectual bloomers (geistig Schnellentwickelnde bzw. Aufblühende) seien. 
Es wurden insgesamt ein Fünftel der Kinder als intellectual bloomers bezeich- 
net; die Auswahl beruhte aber nicht auf den Testergebnissen, sondern auf einer 
zufälligen Ziehung. „Der Unterschied zwischen den Kindern, die als intellektuell 
besonders entwicklungsfähig gekennzeichnet worden waren, und den Kontroll- 
kindern, bei denen diese Kennzeichnung nicht stattgefunden hatte, bestand somit 
nur in den Köpfen der Lehrer“ (Rosenthal & Jacobson, 1971, S. 93). Ein vor- 
läufiger Wiederholungstest wurde im Januar 1965, der grundlegende Nachtest 
im Mai 1965 mit weniger als 400 Kindern und ein weiterer Wiederholungs- 
test im Mai 1966 mit weniger als 300 Kindern (u. a. weil Kinder die Schule 
wechselten) ausgerichtet. Alle Tests wurden von Lehrkräften durchgeführt und 
von Forschungsassistent*innen, die blind gegenüber den Versuchsbedingungen 
waren, ausgewertet. Während nach einem Semester keine signifikanten Unter- 
schiede zwischen Experimental- und Kontrollgruppe zu verzeichnen waren, gab 
es zum grundlegenden Nachtest, also nach einem Schuljahr, einen signifikan- 
ten Effekt (s. Abbildung 6.1): Schiiler*innen der Experimentalgruppe erzielten 
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über alle Klassenstufen hinweg insgesamt vier Punkte mehr beim TOGA als 
Schüler*innen der Kontrollgruppe. Werden die einzelnen Klassenstufen getrennt 
betrachtet, ergaben sich nur für die Klassenstufen 1 (AM = 15, p < .05) und 2 
(AM = 10, p < .05) signifikante Unterschiede. Erstaunlich ist, dass nach zwei 
Jahren (ein Jahr nach dem grundlegenden Nachtest) nur für die Klassenstufe 5 
ein signifikanter Vorteil für die Experimentalgruppe (AM = 11, p < .05) zu 
beobachten war. 
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Abbildung 6.1 Erwartungsvorteil für intellectual bloomers beim Oak School-Experiment 
im Gesamt-IQ nach Zeit (Rosenthal & Jacobson, 1971) 


Angelehnt an die griechische Mythologie (s. Kapitel 4), bezeichneten Rosen- 
thal und Jacobson (1971) dieses Phänomen als Pygmalion-Effekt, da Pygmalion 
seine Erwartungen und Vorstellungen in die Statue hineinmeißelte — wie die 
Erwartungen der Lehrkräfte die Schüler*innen „formten“. Rosenthal und Jacob- 
son (1971) erklärten diesen Erwartungseffekt wie folgt: „Vielleicht behandelten 
die Lehrer ihre Schüler auch freundlicher und liebevoller und zeigten ein größe- 
res Interesse für sie, wenn sie positivere Erwartungen über deren intellektuelle 
Entwicklung hatten“ (S. 199). Brophy und Good (1976; vgl. Tauber, 1997) 
beschreiben den Pygmalion-Effekt in verschiedenen Phasen: Die Lehrperson 
entwickelt unterschiedliche (Kompetenz-)Erwartungen an die Lernenden und 
behandelt sie in Abhängigkeit der Erwartungsausprägung unterschiedlich. Das 
Verhalten der Lehrperson transportiert somit die Erwartung. Dadurch verändern 
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sich das Selbstkonzept und die Motivation der Lernenden sowie die Interaktion 
mit der Lehrperson, was Фе Erwartungen der Lehrperson verstärkt und — je 
nach Erwartungsausprägung — zu geringeren oder höheren Leistungen führt. Sind 
die Erwartungen der Lehrpersonen jedoch flexibel, wird sich mit der Zeit eine 
realistische, zutreffende Erwartung ausbilden. 

Wie sich das Verhalten der Lehrpersonen auf Basis der Erwartungen genau 
verändert, beschreibt Rosenthal in einer 4-Faktoren-Theorie (u. a. Harris & 
Rosenthal, 1985; Rosenthal, 1994). Demnach werden Erwartungen über die 
Atmosphäre (climate), das Feedback, den Input und die Output-Möglichkeiten 
mediiert. Lehrpersonen schaffen für vermeintlich kompetente Lernende (wie 
im Fall der intellectual bloomers) ein wärmeres sozioemotionales Klima und 
sie geben schneller, kontingenter und differenzierter Feedback auf Antworten 
(vermeintlich) kompetenter Lernender. Weitergehend geben Lehrpersonen Ler- 
nenden, an die sie hohe Kompetenzerwartungen haben, mehr Input, d. h., 
diese Lernenden erhalten mehr Material und schwierigere Aufgaben, und mehr 
Output-Möglichkeiten, also mehr Möglichkeiten, sich zu äußern und sich in 
den Unterricht zu integrieren. Die Mediation über diese vier Faktoren konnte 
auch meta-analytisch untermauert werden (Harris & Rosenthal, 1985). Auch 
in einer jüngeren Untersuchung ergab sich bei Rubie-Davis (2007), dass Lehr- 
kräfte mit hohen Kompetenzerwartungen an die Leseleistung der unterrichteten 
Klasse u. a. mehr Feedback gaben, mehr offene Fragen stellten, häufiger trans- 
parente Aufgabenstellungen gaben (procedural statements) und häufiger positives 
Verhaltensmanagement (im Sinne positiver Verstärkung) zeigten. 

Die Ergebnisse von Rosenthal und Jacobson (1966, 1971) sind schon früh 
kritisiert worden (z. B. Elashoff & Snow, 1972; vgl. u. a. Jussim & Harber, 
2005; Lorenz, 2019; Ludwig, 2018). Dass die Intelligenzentwicklung unge- 
wöhnlich hoch und die Intelligenzmessung unreliabel sowie nicht objektiv war 
(z. B. haben teilweise die Lehrkräfte selbst die ersten Tests durchgeführt), 
stand allen Kritiken voran. Weitergehend zeigten sich die Unterschiede zwi- 
schen Experimental- und Kontrollgruppe nur in den unteren Jahrgängen (Klasse 
1 und 2) und nicht mehr in den höheren (Klasse 3 bis 6), sodass insgesamt 
nur ein schwacher Effekt zu beobachten ist (d = 0.28, eigene Berechnung auf 
Basis der berichteten Mittelwerte, Standardabweichungen und Stichprobengrö- 
Ben bei Rosenthal und Jacobson (1966, 1971); Raudenbush (1984) berichtet eine 
Gesamteffektstärke von d = 0.21). Außerdem hätten die Lehrkräfte durch die 
Cover-Story, es ginge um die Identifikation von Hochbegabten, ein besonderes 
Verpflichtungs- und Verantwortungsgefühl gegenüber den vermeintlichen intel- 
lectual bloomers spüren können. Auch konnte sich ein Großteil der Lehrkräfte in 
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anschließenden Interviews kaum an die vermeintlich hochbegabten Kinder erin- 
nern. All diese Überlegungen führen zu der Frage, wie groß der Einfluss der 
Kompetenzerwartungen von Lehrpersonen ist. 

Hattie (2015) kam unter Berücksichtigung von acht Meta-Analysen, in 
denen insgesamt 784 Effekte berücksichtigt wurden, auf eine Effektstärke von 
d = 0.43 („erwünschte Effekte“) von Lehrendenkompetenzerwartungen für den 
Unterricht. Dies entspricht einem kleinen bis mittleren Effekt (Cohen, 1988). 
Bei einer genaueren Betrachtung der eingegangenen Meta-Analysen stellt sich 
heraus, dass diese selten den Effekt von Lehrendenkompetenzerwartungen auf 
Lernende fokussieren (wie beim Pygmalion-Effekt), sondern auch die Ausbildung 
bzw. Quellen von (Kompetenz-)Erwartungen betrachten. Auch gingen Kompeten- 
zerwartungen tiber das Lernen bei Tieren in den von Hattie (2015) berichteten 
Effekt ein. Es ist also nicht eindeutig, was genau Hattie (2015) unter „Leh- 
rererwartungen“ fasst. Weitergehend ist stellenweise intransparent, wie Hattie 
(2015) die mittleren Effektstärkemaße bestimmte und wie die berichteten Anga- 
ben zustande kamen. So stimmt beispielsweise die Anzahl der eingegangenen 
Studien für die Meta-Analyse von Smith (1980) mit 47 nicht mit der Angabe 
von 46 bei Hattie (2015) überein. Außerdem ermittelte Raudenbush (1984) eine 
mittlere Effektstärke von d = 0.11, die Hattie (2015) mit d = 0.08 angibt. 

Smith (1980) berichtet in einer Meta-Analyse einen Einfluss der Lehrenden- 
kompetenzerwartung auf die Lernendenleistung mit einer Effektstärke von Glass’ 
A = 0.38! 2 und auf den IQ mit einer Effektstärke von Glass’ A = 0.16. 
Raudenbush (1984) bestimmte eine ähnliche, mittlere Effektstärke von d = 0.11 
für Lehrendenkompetenzerwartungen auf den IQ von Kindern. Einen Wert von 
d = 0.54 ermittelten Rosenthal und Rubin (1978) für die Kategorie Lernen und 
Fähigkeiten (darunter IQ-Testergebnisse und verbale Fähigkeiten) sowie einen 
Wert von d = 0.88 für alltägliche Situationen wie Symbollernen und athleti- 
sche Leistung. Insgesamt machten Rosenthal und Rubin (1978) eine Effektstärke 
von d = 0.70 von Kompetenzerwartungen auf Leistungsergebnisse aus (über 345 
Experimente, darunter auch Studien zum Lernen bei Tieren). Später bestimmte 
Rosenthal (1991, nach Rosenthal, 1994) meta-analytisch über 464 Studien eine 
Effektstärke von d = 0.63. 


| Glass’ A ist ein Effektstärkemaß, bei dem eine Mittelwertsdifferenz an der Standardabwei- 
chung einer Kontrollgruppe normiert wird (vgl. Bühner & Ziegler, 2009). 

2 Im Fließtext beschreibt Smith (1980), dass die Basis für die Effektstärke auf 44 Effekten 
beruht, in der Tabelle berichtet sie 22 eingegangene Effekte. An einigen Stellen stimmt die 
Anzahl der Effekte in der Hauptkategorie nicht mit der summierten Anzahl der Effekte in 
den Subkategorien überein. 
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Jussim und Harber (2005) stellen in einem Review heraus, dass es unklar 
ist, ob durch Erwartungseffekte der IQ beeinflusst werden kann. Insgesamt wird 
jedoch an anderen Stellen resümiert, dass die Effekte für akademische Leistung 
i. d. К. größer ausfallen als die für die allgemeine intellektuelle Fähigkeit (Smith, 
1980; vgl. u. a. Lorenz, 2019, Ludwig, 2018). Trotz Kritik an der Originalstudie 
von Rosenthal und Jacobson (1966, 1971) halten Jussim und Harber (2005) fest, 
dass Erwartungseffekte in Lehr-Lern-Kontexten auftreten und der Pygmalion- 
Effekt besonders bei beginnenden Interaktionen sowie bei Interaktionen mit 
Lernenden aus stigmatisierten Gruppen bedeutsam ist. 

Der Pygmalion-Effekt ist ein fremdbezogener Erwartungseffekt, aber im Pro- 
zess können auch selbstbezogene Erwartungen und Erwartungs-Erwartungen 
bedeutsam sein (s. Kapitel 4). So werden durch die Wahrnehmung des Verhaltens 
und die Äußerungen der Lehrpersonen durch die Lernenden das akademische 
Selbstbild der Lernenden beeinflusst (vgl. Brophy & Good, 1976) und weiter- 
gehend selbstbezogene Erwartungen induziert. Darüber hinaus (oder alternativ) 
können die Lernenden auch Erwartungs-Erwartungen aufbauen, z. B. bei gerin- 
gen Lehrendenkompetenzerwartungen (,,Egal, was ich mache und wie ich mich 
anstrenge, die Lehrperson nimmt meine Anstrengungen nicht wahr, also lohnt 
sich die Mühe nicht‘). In der Lehr-Lern-Interaktion können diese Prozesse 
zeitversetzt, aber auch parallel verlaufen. Das bedeutet, dass Lehrendenkompe- 
tenzerwartungen in die Interaktion hineingetragen werden (z. B. durch vorherige 
Informationen über Lernende oder Stereotype) und ursächlich für Interaktions- 
muster (fremdbezogener Erwartungseffekt) sein können, aber sie können auch 
Resultat von selbstbezogenen Erwartungen und/oder Erwartungs-Erwartungen 
aufseiten der Lernenden sein. 


36 6 Der Pygmalion-Effekt 


Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 Inter- 
national Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche 
die Nutzung, Vervielfaltigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem 
Medium und Format erlaubt, sofern Sie den/die urspriinglichen Autor(en) und die Quelle 
ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, 
ob Änderungen vorgenommen wurden. 

Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen eben- 
falls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts 
anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Com- 
mons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt 
ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des 
jeweiligen Rechteinhabers einzuholen. 


® 


Check for 
updates 


Das transaktionale Modell der 7 
Lehr-Lern-Beziehung 


Der Pygmalion-Effekt und der Prozess der selbsterfüllenden Prophezeiung 
sind Phänomene der Lehr-Lern-Interaktion, die Bestandteile des transaktiona- 
len Modells von Nickel (1985; Original von 1976; s. Abbildung 7.1) sind. Das 
transaktionale Modell der Lehr-Lern-Beziehung von Nickel (1985) erweitert uni- 
direktionale Modelle der pädagogischen Beziehung und postuliert, dass Lernende 
und Lehrpersonen gleichermaßen den Interaktionsverlauf beeinflussen. Lernende 
und Lehrpersonen stehen in einer echten „Wechselbeziehung [...], an der beide 
Seiten aktiven Anteil haben und durch die sie ihr Verhalten gegenseitig beein- 
flussen“ (Nickel, 1985, S. 267), es finden also ständig Rückkopplungsprozesse 
statt. Nickel (1985) postuliert weiterhin, dass sowohl intrapsychische als auch 
soziokulturelle Phänomene die Lehr-Lern-Interaktion mitbestimmen. 

Zu den intrapsychischen Bedingungsvariablen zählt Nickel (1985) Einstellun- 
gen, Erwartungshaltungen, darunter Rollenerwartungen, implizite Persönlichkeits- 
und Führungstheorien sowie verinnerlichte Werte, (Gruppen-)Normen und 
Gewohnheiten. Diese Variablen bilden ein „kognitives Modell“ (Nickel, 1985, 
bezieht sich hier auf Argyle, 1972; vgl. relationale Schemata bei Thies, 2010), 
das zwischen Reizen und Verhalten vermittelt. Dieses kognitive Modell lässt 
einerseits das Verhalten anderer Personen beurteilen und , filtern“, sodass es zu 
verzerrten Wahrnehmungen und Interpretationen des Verhaltens kommen kann, 
und andererseits bestimmt es das eigene Verhalten. So kann ein Selbstverständ- 
nis der Lehrperson als wissensvermittelnde und weniger als erziehende Person 
dazu führen, dass Verhaltensauffälligkeiten hauptsächlich in Misserfolgen (man- 
gelnde Anstrengung und Begabung) begründet gesehen werden (vgl. Nickel, 
1985). Außerdem sollte mit diesem Selbstverständnis das Unterrichtsverhalten 
der Lehrperson von einem eher an Erziehungsprozessen orientierten Verhalten 
der Lehrperson verschieden sein, was sich z. B. in einem eher fordernden und 
distanzierten Stil bemerkbar machen kann. 
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Die kognitiven Modelle bilden sich vor dem Hintergrund eines soziokultu- 
rellen Bezugsrahmens (vgl. sozialisationstheoretisches Modell des Unterrichts, 
Helmke, 2017). Dieser ist sowohl bei den Lehrpersonen als auch bei den Lernen- 
den durch die soziale Lernvergangenheit (z. B. bisherige Erziehungserfahrungen), 
die gegenwärtigen sozialen Beziehungen (z. B. Familie, Mitschiiler*innen bzw. 
Kolleg*innen) und durch objektivierte Einflüsse (z. B. Medien, Richtlinien) 
bestimmt (s. Abbildung 7.1). Zusätzlich entstehen Erwartungen und Einstellun- 
gen gegenüber einer spezifischen Person innerhalb der Interaktion (interaktionale 
Schemata bei Thies, 2010). So kann es sein, dass eine Professorin von einem 
Studenten antizipatorisch erwartet, er sei faul, weil sie diese Information über 
den Studenten von einem Kollegen erhalten hat. Allerdings zeigt sich der Student 
in der Lehrveranstaltung engagiert und bringt sich mit vielen qualitativ wert- 
vollen Wortmeldungen ein. Dies kann die vorherige Erwartung umstrukturieren. 
Zusätzlich hat auch der Student Erwartungen an die Professorin, die parallel zu 
denen der Professorin in der Interaktion wirken. Mit der Zeit stellt sich dann ein 
bestimmtes Interaktionsmuster ein, das sich durch Rückkopplungsprozesse stabi- 
lisiert und durch Zirkularität (u. a. Haken & Schiepek, 2010; Hubrig & Herrmann, 
2014; Strunk & Schiepek, 2006) gekennzeichnet ist, also durch eine gegenseitige 
Wechselwirkung. 

Insbesondere der Pygmalion-Effekt (Rosenthal & Jacobson, 1966, 1971; s. 
Kapitel 6) wird von Nickel (1985) aufgegriffen, um sein Modell zu unterstützen 
und zu illustrieren. Die Information durch Forschende (also vom soziokulturellen 
Bezugsrahmen), dass eine*ein Schüler*in im kommenden Schuljahr eine beson- 
dere Kompetenzsteigerung zeigen wird (intellectual bloomer), induziert bei der 
Lehrperson eine Erwartung. Im realistischen Kontext können Kompetenzerwar- 
tungen beispielsweise durch Mitteilung bisheriger Noten entstehen oder durch 
Stereotype (s. Kapitel 5 und Kapitel 9). Die Erwartung führt bei der Lehrkraft zu 
einem positiveren, zugewandteren, wärmeren, unterstützenderen Verhalten gegen- 
über dieser*diesem Schüler*in im Vergleich zum Rest der Klasse (vgl. u. a. 
Brophy & Good, 1976). Im Sinne der 4-Faktoren-Theorie (Harris & Rosen- 
thal, 1985; Rosenthal, 1994) sind die Atmosphäre (climate), das Feedback, die 
Input- und die Output-Möglichkeiten relevant, um die Kompetenzerwartungen 
(indirekt) auszudrücken. Die Lehrkraft macht folglich ein anderes Unterrichtsan- 
gebot (vgl. Angebots-Nutzungs-Modelle; u. a. Helmke, 2017; Reusser & Pauli, 
2010). Dieses Verhalten wird von der lernenden Person wahrgenommen, führt 
zu einer konkreten Erwartung gegenüber der Lehrperson („Die Lehrkraft ist nett 
und hilfsbereit“) und somit zu einem Verhalten, das das Angebot der Lehrperson 
nutzt. Diese Angebotsnutzung wiederum führt zu einem Kompetenzaufbau, den 
die Lehrperson (z. B. in Leistungstests) wahrnimmt, sowie zu einer Bestätigung 
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der Erwartung und setzt einen „Engelskreislauf“ (verstanden als positives Pen- 
dant zum Teufelskreislauf) in Gang. Im Laufe der Zeit entwickelt sich ein immer 
robusteres interaktionales (auf die dyadische Interaktion bezogenes) Schema 
(Thies, 2010), das im Sinne der selbsterhaltenden Prophezeiung wirken kann 
(Ludwig, 2018; s. Kapitel 3). 
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Normative Erwartungen in der 8 
Interaktionsregulation 


Rosemann (1978) stellt neben den Erwartungen von Interaktionspartner*innen an 
die jeweils andere Person auch explizit die Bestätigung bzw. Widerlegung dieser 
Erwartungen in den Vordergrund seiner Überlegungen. Er spricht von Erwar- 
tungskonkordanz und -diskordanz. Die individuelle Erwartungskonkordanz ist 
dann gegeben, wenn eine Person A ,,[...] die Person В als in Übereinstimmung 
mit ihren an diese Person gerichteten Erwartungen erlebt. Bei Diskrepanzerleb- 
nissen sprechen wir von Erwartungsdiskordanz“ (Rosemann, 1978, S. 42). Für 
sein Modell bezieht sich Rosemann (1978) auf normative Erwartungen, d. h. auf 
Vorstellungen und Schemata, wie ein Mensch in einer bestimmten Situation sein 
sollte und welche Rolle ihm zukommt. Es handelt sich folglich um ein Idealbild. 
Die Erwartungen und der Stellenwert der Erwartungen können zwischen unter- 
schiedlichen Personen variieren und somit unterschiedliche Reaktionen auf das 
gleiche Verhalten hervorrufen. Als weitere Gruppe von Erwartungen diskutiert 
Rosemann (1978) Verhaltensantizipationen (antizipatorische Erwartungen; inter- 
aktionale Schemata bei Thies, 2010), die er als ,,[...] (gedankliche) Vorwegnahme 
des zukünftigen Verhaltens des [Interaktions-]Partners“ (S. 40) bestimmt und auf 
den Pygmalion-Effekt, in dem die Beschreibung der zukünftigen intellektuellen 
Entwicklung eines Kindes als Erwartungsinduktion dient (Rosenthal & Jacobson, 
1966, 1971), bezieht (vgl. Schweer, 2019). 

Lernende, unabhängig ob in Schule oder Hochschule, erwarten von Lehr- 
personen i. d. R. fachliche Kompetenz, Freundlichkeit und Unterstützung sowie 
motivierenden Unterricht (u. a. Apel & Sandfuchs, 2003; Beishuizen et al., 2001; 
Denner et al., 2003; Merzyn, 2017; Richey, 2016; Sänchez et al., 2011; Yer- 
mack & Forsyth, 2016). Diese Erwartungen lassen sich in zwei unterschiedliche 
Themen einsortieren: in ein love theme (soziale Kompetenz) und ein mas- 
tery theme (Fachkompetenz; Ditton, 2002; Schweer & Rosemann, 1995). Dabei 
beinhaltet das love theme Wärme, Zuwendung sowie die Berücksichtigung von 
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Angsten, Wiinschen und Problemen der Lernenden. Fachwissen, qualitative 
Unterrichtsgestaltung, Disziplinierungs- und Durchsetzungsfähigkeit beschreiben 
das mastery theme. Lernende wünschen sich eher „demokratisch Führende“ als 
Lehrpersonen (Denner et al., 2013), wobei die Relevanz der beiden Dimensionen 
zwischen Alter und Geschlecht variiert (Denner et al., 2013; Ditton, 2002). 

Lehrkräfte erwarten hingegen angepasste, ordentliche und ruhige Schü- 
ler*innen (vgl. Richey, 2016; Rosemann, 1978): „Die Wunschschüler sind 
folgsame, interessierte, kreative, zur Selbsttätigkeit bereite Schüler, welche sich 
dem erzieherischen Handeln unterordnen, oder besser: es einsichtig anerkennen 
als Wert für ihre eigene Entwicklung, Bildung und Sozialisation“ (Ntemiris, 2011, 
S. 92). Eigenschaften, die sich Dozierende von Studierenden wünschen, sind 
Teilnahme- und Durchhaltewille, Respekt und Anstand, Vorbereitung, Aufmerk- 
samkeit, Reflexionsvermögen, Wissen und Kommunikationskompetenz (Voss & 
Eicher, 2015). Weitergehend zeigte sich, dass Dozierende als sehr wichtige Her- 
ausforderung für Studierende das Zeitmanagement, die Motivation für und die 
Fokussierung auf das Studium sowie die Aneignung einer wissenschaftlichen 
Arbeitshaltung benennen (Berthold et al., 2011), woraus sich auch Erwartungen 
an Studierende herausbilden. Im weiteren Sinne können auch hier das love theme 
(u. a. Respekt, Anstand, Angepasstheit im Sinne von Harmonieerhaltung) und das 
mastery theme (u. a. Motivation, Wille zum Aufbau von Wissen, Vorbereitung) 
wiedergefunden werden. Die normativen Erwartungen sowohl an Lernende als 
auch an Lehrpersonen lassen sich auch im Kontext des stereotype content model 
(s. Kapitel 5) betrachten: Das love theme entspricht weitestgehend der Wärme- 
Dimension und das mastery theme weitestgehend der Kompetenz-Dimension im 
stereotype content model. 

Auf Basis dieser idealtypischen normativen Erwartungen wird nun das Verhal- 
ten einer konkret beobachteten Person wahrgenommen und bewertet. Dabei wird 
sich ein für die einzelne Person spezifisches Bild gemacht und dieses Bild führt 
dann zu gewissen Verhaltensantizipationen. Stimmen die Verhaltensantizipationen 
mit den normativen Erwartungen mehrheitlich überein, liegt also Erwartungs- 
konkordanz vor, kommt es zu Zufriedenheit und folglich zu einem positiven 
Verhalten der wahrgenommenen Person gegenüber. Erwartungsdiskordanz hin- 
gegen führt nach Rosemann (1978) zu Unzufriedenheit und weniger positivem 
und/oder mehr negativem Interaktionsverhalten. Diese Prozesse laufen bei allen 
Interaktionspartner*innen ab und können über diverse Rückkopplungen zu posi- 
tiven Engelskreisen oder negativen Teufelskreisen führen. Je nach normativen 
Erwartungen und erlebtem Verhalten wird ein anderes Angebot für die Lehr- 
Lern-Interaktion bereitgestellt (vgl. Angebots-Nutzungs-Modelle, z. B. Helmke, 
2017; Reusser & Pauli, 2010). 
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Nimmt also beispielsweise eine Lehrperson eine Schiilerin als ordentlich und 
ruhig wahr, baut sie ein interaktionales Schema und somit Verhaltensantizipatio- 
nen auf („Diese Schülerin wird sich ordentlich und ruhig verhalten“). Sind diese 
mit den normativen Erwartungen konkordant, wird die Lehrperson wahrschein- 
lich zufrieden sein. Diese Zufriedenheit spiegelt sich dann im Verhalten wider, 
sodass sich die Lehrperson gegenüber der Schülerin positiver, d. h. unterstüt- 
zender, wärmer und ermutigender verhält. Gleichzeitig nimmt die Schülerin die 
Lehrperson wahr, z. B. als kompetent und unterstützend. Dieses wahrgenommene 
Verhalten wird mit ihren normativen Erwartungen abgeglichen und bei Erwar- 
tungskonkordanz verhält sich die Schülerin leistungsbereiter, interessierter und 
weniger störend. Bei Erwartungskonkordanz von Studierenden wurden in einer 
Untersuchung von Schweer und Rosemann (1995) das Lehrverhalten, der Lerner- 
folg und das Vertrauen zur dozierenden Person signifikant günstiger eingeschätzt 
als bei Erwartungsdiskordanz. 

Der wesentliche Unterschied zum transaktionalen Modell von Nickel (1985) 
liegt darin, dass sich das Verhalten einer Person nach Rosemann (1978) aus dem 
Abgleich von normativen Erwartungen (Idealvorstellungen) mit personenspezi- 
fischen Erwartungen (Verhaltensantizipation) einer*eines Interaktionspartner*in 
ergibt. Bei Nickel (1985) ergibt es sich direkt aus den (bereits vorweg bzw. 
mit dem ersten Eindruck entstandenen) positiven oder negativen Erwartungen 
gegenüber der*dem Interaktionspartner*in, die sich jedoch vergleichbar zu Rose- 
manns Ansatz durch personenspezifische Erfahrungen umstrukturieren können 
(vgl. Schweer, 2019). 
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Kompetenzerwartungen von Lehrpersonen an Lernende können auf einer Reihe 
von Informationen beruhen, darunter auf Berichten von Kolleg*innen oder 
Erzählungen von Erziehungsberechtigten bzw. Angehörigen. Ohne solche Infor- 
mationen spielen insbesondere Stereotype eine Rolle: Die stereotypen Bilder von 
Angehörigen bestimmter sozialer Gruppen gehen mit Eigenschaftszuschreibun- 
gen und somit auch mit Erwartungshaltungen einher (u. a. Stangor, 2009; s. 
Kapitel 5). In einer Meta-Analyse von Südkamp et al. (2012) konnte ein rela- 
tiv hoher Zusammenhang zwischen der Lehrendeneinschätzung zur Leistung von 
Lernenden und der tatsächlichen akademischen Leistung der Lernenden ausge- 
macht werden (r = .63). Wenngleich Erwartungen häufig zutreffend sind, können 
sie dennoch stereotypbasiert zu selbsterhaltenden Prophezeiungen führen (vgl. 
Ludwig, 2018), sodass sich Lernende (im Sinne eines Andorra-Effekts) an die 
Lehrendenerwartungen anpassen (vgl. Lies et al., 2015; s. Kapitel 3 und Kapi- 
tel 4). Erste ggf. zutreffende Lehrendenerwartungen basierend auf Stereotypen 
(z. В. „Mädchen sind schlecht in Physik“) können also zuerst selbsterfüllend sein, 
dann aber selbsterhaltend werden, da sich die Lernenden innerhalb der Interak- 
tion dem Stereotyp immer weiter annähern (z. B. „Ich bin ein Mädchen, ich 
kann kein Physik“), obwohl sie potenziell in der Lage wären, das Stereotyp zu 
widerlegen. Nach einem solchen Prozess kann die Lehrendeneinschätzung einen 
hohen Zusammenhang mit der akademischen Leistung haben, nicht aber mit dem 
akademischen Potenzial. 

Bei der sozialen Wahrnehmung — auch in akademischen Settings — spielen in 
erster Linie die automatischen Kategorien (Fiske & Neuberg, 1990; Krings & 
Kluge, 2020) eine Rolle sowie die physische Attraktivität. Zu den automati- 
schen Kategorien gehören Geschlecht, Ethnie und Alter, da sie sehr schnell (und 
automatisiert) über das optische Erscheinungsbild vermeintlich relativ zutreffende 


© Der/die Autor(en) 2022 45 
M. Hackbart, Die Lehrperson als Golem oder Galatea, 
https://doi.org/10.1007/978-3-658-39444-8_9 


46 9 Stereotypbasierte Lehrendenerwartungen 


Informationen liefern. Dariiber hinaus beeinflusst auch der soziodkonomische Sta- 
tus der Lernenden die Lehrendenerwartungen (vgl. Brophy & Good, 1976). Im 
Folgenden wird ein Uberblick iiber empirische Befunde zu stereotypbasierten 
Lehrendenerwartungen dargestellt. 


9.1 Geschlecht! 


In Alltagsdiskursen findet sich haufig die Auffassung, dass Madchen und Frauen 
bessere sprachliche Fähigkeiten haben als Jungen und Männer. Letztere wiederum 
sind vermeintlich kompetenter im mathematischen und technischen Bereich (u. a. 
Nosek et al., 2009; Su et al., 2009). In Meta-Analysen konnte im Widerspruch 
zu solchen Stereotypen jedoch kein bedeutsamer Leistungsunterschied zwischen 
männlichen und weiblichen Lernenden in Mathematik-Leistungstests (d = 0.05; 
Lindberg et al., 2010) oder in verbalen Fähigkeiten (d = 0.11, dabei d = 0.20 für 
die generelle verbale Fähigkeit, Hyde & Linn, 1988; d = 0.19 für die Leseleis- 
tung, Lietz, 2006) ausgemacht werden. Dennoch wurden solche Stereotype von 
Lehrpersonen und angehenden Lehrpersonen teilweise berichtet (u. a. Li, 1999; 
Lorenz et al., 2016; Tiedemann, 1995, 2002). Auch bei Gentrup et al. (2018) 
hatten Grundschullehrkräfte signifikant höhere Erwartungen an Mädchen bezüg- 
lich ihrer Sprachfähigkeit und an Jungen hinsichtlich ihrer Mathematikleistung. 
Erwähnenswert ist zudem, dass die Lehrkräfte mehr Motivation und eine höhere 
Arbeitsmoral von den Mädchen im Vergleich zu den Jungen erwarteten. 
Insgesamt zeichnet sich domänenunabhängig eine positivere Bewertung von 
weiblichen Lernenden im Vergleich zu männlichen ab und es wird von „männ- 
lichen Bildungsverlierern“ (u. a. Diefenbach, 2010) gesprochen. Dies erscheint 
vor dem Hintergrund, dass die kommunalen Eigenschaften (z. B. kommunika- 
tiv, kooperativ, emotional), die eher Mädchen und Frauen zugeschrieben werden 
(u. a. Bosak et al., 2008; Diehl et al., 2004), dem Wunschbild einer lernenden 
Person (Ntemiris, 2011; Rosemann, 1978; Voss & Eicher, 2015; vgl. Kapitel 8) 
entsprechen, nicht verwunderlich. So schrieben Lehrkräfte in einer Studie von 
Heyder und Kessels (2015) insbesondere sich „maskulin“ verhaltenden männ- 
lichen Schülern ein geringeres akademisches Engagement zu. Voyer und Voyer 
(2014) zeigten meta-analytisch, dass Frauen und Mädchen bessere Noten erzielen 
als ihre männlichen Kommilitonen bzw. Klassenkameraden (d = 0.23), wobei das 


' Es sei hier darauf hingewiesen, dass es mehr als zwei Geschlechter gibt (vgl. Hackbart & 
Tischoff, 2020; Timmermanns & Böhm, 2020). Allerdings werden in der Forschung zu 
Stereotypen kaum Geschlechtlichkeiten über ein binäres Modell hinaus berücksichtigt (vgl. 
Hackbart, 2020). 


9.2 Ethnie und Migrationshintergrund 47 


Ausmaß über verschiedene Fächer variiert (d = 0.37 für Sprachen bzw. Sprach- 
wissenschaften, d = 0.07 fiir Mathematik, d = 0.15 fiir Naturwissenschaften 
(sciences) und d = 0.17 für Sozialwissenschaften (social sciences)). Für den 
schulischen Kontext in Deutschland resümiert Budde (2008, S. 16): „In allen 
Fächern erhalten Jungen auch bei gleichen Kompetenzen schlechtere Noten.“ 
Wenngleich viele Studien keine bedeutsamen Unterschiede zwischen den Kom- 
petenzerwartungen an Frauen bzw. Mädchen und Männern bzw. Jungen fanden 
(u. a. Auwarter & Aruguete, 2008), zeigten die meisten Studien mit Unter- 
schieden leicht höhere Lehrendenkompetenzerwartungen an weibliche Lernende 
(d = 0.20 in der Meta-Analyse von Dusek & Joseph, 1983). 


9.2 Ethnie und Migrationshintergrund” 


In Deutschland leben etwa 20.1 Millionen Menschen mit Migrationshintergrund, 
das entspricht 24 % der Gesamtbevölkerung (im Kalenderjahr 2019; Statistisches 
Bundesamt, 2020a). Von ihnen hatten die meisten einen türkischen Migrati- 
onshintergrund oder eine türkische Migrationsbiografie (2.8 Millionen, 14 %; 
Statistisches Bundesamt, 2020a). Menschen mit türkischem Migrationshinter- 
grund werden in Deutschland als prototypische Ausländer*innen angesehen (vgl. 
Cohrs & Asbrock, 2009) und ihnen werden weniger positive als negative Eigen- 
schaften zugeschrieben (Froehlich et al., 2016; Kahraman & Knoblich, 2000). 
Auf den Dimensionen des stereotype content model werden Türk*innen kalt und 
inkompetent bis mittelhoch kompetent bewertet (Asbrock, 2010; Cuddy et al., 
2007). 

Glock und Krolak-Schwerdt (2013) ließen Lehramtsstudierende vermeintli- 
che Kommiliton*innen auf der Basis textbasierter Fallvignetten bewerten, in 
denen die ethnische Zugehörigkeit mithilfe des Namens (Michael als deut- 
scher, autochthoner Student oder Aslan als türkischstämmiger Student) und 
eine Kompetenzerwartung („Bester in der Klasse“ oder „unterdurchschnittlicher 
Student“) systematisch variierten. Insgesamt zeigte sich, dass der autochthone 
Student über alle Bedingungen hinweg als leistungsstärker bewertet wurde als 
der türkischstämmige Student. Allerdings ergaben sich bedeutsame Unterschiede 
nur bei der Golem-Bedingung (,,unterdurchschnittlicher Student“) für die ver- 
bale Leistungsfähigkeit. Für die mathematische Leistungsfähigkeit und in der 


? Ethnie und Migrationshintergrund werden in dieser Arbeit synonym für nicht-autochthone 
Bevölkerungsgruppen verwendet. 
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Galatea-Bedingung konnten keine signifikanten Unterschiede in den Beurtei- 
lungen ausgemacht werden. Die Ergebnisse konnte Glock (2016) an einer 
Stichprobe mit berufstätigen Lehrkräften replizieren. Bei einem Vergleich von 
türkischstämmigen Kindern mit Kindern ohne Information zur Ethnie beurteil- 
ten Lehrkräfte und Lehramtsanwärter*innen die Leistung beschriebener Kinder 
ähnlich (Glock & Krolak-Schwerdt, 2014). Der eigene ethnische Background 
der Lehrperson scheint die Zusammenhänge jedoch zu moderieren. So zeig- 
ten Lehramtsanwärter*innen einer ethnischen Minderheit positivere Einstellungen 
gegenüber Schiiler*innen mit Migrationsbiografie als Lehramtsanwärter*innen 
der ethnischen Majorität (Glock & Kleen, 2019). 

Lorenz (2019) resümiert für Deutschland, dass Grundschullehrkräfte verzerrte 
Kompetenzerwartungen auf Basis des Migrationshintergrundes haben. So wurden 
türkischstämmige Schüler*innen sowohl im Fach Deutsch als auch in Mathematik 
als weniger kompetent angesehen als deutsche. Demgegenüber gab es keine Ver- 
zerrung bei Kindern mit osteuropäischem Migrationshintergrund im Fach Deutsch 
und eine Verzerrung der Kompetenzerwartungen zugunsten von Kindern mit ost- 
europäischem Migrationshintergrund im Fach Mathematik (vgl. Lorenz et al., 
2016). 

In anderen kulturellen Kontexten spielen aufgrund von Einwanderung andere 
Ethnien eine Rolle. So wird beispielsweise in Neuseeland zu Beginn eines Schul- 
jahres ostasiatischstämmigen Kindern von Lehrkräften die höchste mathematische 
Kompetenz zugeschrieben und den Kindern der Mäori die geringste (Peterson 
et al., 2016). In der US-amerikanischen Meta-Analyse von Dusek und Joseph 
(1983) zeigte sich, dass „dunkelhäutigen“ Menschen (persons of color; Afroame- 
rikaner*innen und Mexikaner*innen) eine geringere Kompetenz zugeschrieben 
wird als „hellhäutigen“. Dieser Effekt ist mit d = 0.11 jedoch sehr klein. In einer 
späteren Meta-Analyse von Tenenbaum und Ruck (2007) ergab sich das Bild, 
dass im Vergleich zu angloamerikanischen Lernenden asiatisch-amerikanische 
(Asien Americans) von Lehrpersonen als besonders kompetent (d = 0.17) und 
lateinamerikanische (d = 0.46) sowie afroamerikanische Lernende (d = 0.25) 
als weniger kompetent betrachtet werden. 


9.3 Sozioökonomischer Status und Namen 


Häufig sind Menschen, die einen Migrationshintergrund haben bzw. einer von 
der Mehrheit abweichenden Ethnie angehören, auch Mitglieder sozioökonomisch 
schwacher Gruppen. So ist der Anteil von Personen ohne Schulabschluss bei 
Menschen mit Migrationshintergrund (10 %) höher als bei autochthonen (1 %; 
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Statistisches Bundesamt, 2020a). Außerdem sind prozentual mehr Menschen mit 
Migrationshintergrund als autochthone erwerbslos (6 % zu 2 %) und haben 
im Durchschnitt ein geringeres Nettoeinkommen (1837 € zu 2225 €; Statis- 
tisches Bundesamt, 2020a). Aber auch Menschen ohne Migrationshintergrund 
können, wie die genannten Zahlen zeigen, einen geringen sozioökonomischen 
Status haben, der sich auf die interpersonalen Erwartungen auswirken kann. 

Bei Auwarter und Aruguete (2008) zeigte sich, dass Lehrkräfte auf Basis von 
textbasierten Fallvignetten von Schüler*innen geringere Leistung in der Zukunft 
erwarten, wenn die Schüler*innen einen geringen sozioökonomischen Status 
haben. Glock und Krolak-Schwerdt (2014) konnten hingegen mithilfe von zwei 
Fallvignetten, die beide Kinder mit Migrationshintergrund beschrieben, keinen 
Einfluss des sozioökonomischen Status auf die Leistungsbewertung ausmachen. 
Bei Lehrkräften, die Lorenz et al. (2016) untersuchten, konnte ein Einfluss 
des sozioökonomischen Status auf die Lehrendenkompetenzerwartungen gefun- 
den werden. Bei der Meta-Analyse von Dusek und Joseph (1983) werden mit 
einer Effektstärke von d = 0.47 Lernende aus dem Mittelstand für kompetenter 
gehalten als Lernende aus „unteren Schichten“. 

Ist der sozioökonomische Status nicht bekannt, können auch Namen einen 
Hinweis liefern und Erwartungen formen (vgl. Dusek & Joseph, 1983). Bei 
Tobisch und Dresel (2017) erwarteten Lehrkräfte auf Basis des Namens von 
einem Murat (Migrationshintergrund und geringer sozioökonomischer Status) 
eine an den bisherigen Leistungsergebnissen angepasste Note, wohingegen 
von einem Justin (kein Migrationshintergrund und geringer sozioökonomischer 
Status) und von einem Julius (kein Migrationshintergrund und hoher sozioöko- 
nomischer Status) bessere Noten als bisher. Der sozioökonomische Status, der 
mit den Namen verknüpft wurde, hing signifikant mit der Einschätzung der 
generellen Fähigkeit und der der Anstrengung sowie mit Erwartungen an die 
Leistungen in Deutsch und in Sozialwissenschaften (social sciences) zusammen. 
Eine andere Umfrage zur Bewertung von Vornamen durch Lehrkräfte kam zu 
folgenden Ergebnissen (Kaiser, 2009, Absatz 1): 


Als eher freundlicher, leistungsstärker und verhaltensunauffällig stellen sich Kinder 
mit Vornamen wie Charlotte, Sophie, Marie, Hannah, Alexander, Maximilian, Simon, 
Lukas oder Jakob im Bewusstsein von LehrerInnen dar, während Namen wie Chan- 
tal, Mandy, Angelina, Kevin, Justin oder Maurice eher mit Leistungsschwäche und 
Verhaltensauffälligkeit assoziiert werden. Besonders „Kevin“ hat sich als stereotyper 
Vorname für einen „verhaltensauffälligen“ Schüler herausgestellt. In einem Fragebo- 
gen fand sich der Kommentar „Kevin ist kein Name, sondern eine Diagnose!“. 
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9.4 Physische Attraktivitat 


Physische Attraktivität bzw. Schönheit ist ein schwer zu definierendes Konstrukt 
und wird häufig als Mittel subjektiver Bewertungen operationalisiert (Langlois 
et al., 2000). 


Ein wichtiges Ergebnis [bisheriger Attraktivitätsforschung] ist beispielsweise die 
Erkenntnis, dass — anders als der Volksmund behauptet — Schönheit eben nicht (nur) 
im Auge des Betrachters liegt, sondern dass es bei allen „Geschmacksunterschieden“ 
dennoch eine gemeinsame Basis für menschliche Attraktivität gibt, sowohl inner- 
halb einer Kultur als auch mit Abstrichen zwischen verschiedenen Kulturen. (Gründl, 
2011, S. 1) 


So werden beispielsweise symmetrische Gesichter mit reiner Haut als besonders 
attraktiv wahrgenommen. 

Attraktiveren Menschen werden mehr positive Eigenschaften zugeschrieben 
als weniger attraktiven Menschen. Dies ist als „beauty is good“ stereotype (bzw. 
„what is beautiful is good“ stereotype; Dion et al., 1972) bekannt. Meta-analytisch 
zeigten Eagly et al. (1991), dass Attraktivität u. a. einen Effekt auf die Einschät- 
zung der intellektuellen Kompetenz (d = 0.46 entspricht r = .22) hat. In einer 
späteren Meta-Analyse von Jackson et al. (1995) zeigte sich, dass der Zusam- 
menhang von Attraktivität und der Wahrnehmung der intellektuellen Kompetenz 
bei d = 0.65 (r = .31) liegt. Dabei ist der Effekt am stärksten bei der Beurteilung 
von erwachsenen Männern (d = 0.93 entspricht r = .42), am zweitstärksten für 
erwachsene Frauen (d = 0.70 entspricht r = .33) und am schwächsten für Kin- 
der (d = 0.49 entspricht r = .24). Auch bei Langlois et al. (2000) zeigten sich 
meta-analytisch Zusammenhänge zwischen Attraktivität und angenommener aka- 
demischer Kompetenz bei Kindern (r = .48) und der angenommenen beruflichen 
Kompetenz bei Erwachsenen (r = .41). 

Das „beauty is good“ stereotype zeigte sich auch in pädagogischen Kon- 
texten: In einer viel beachteten Studie von Landy und Sigall (1974) wurde 
männlichen Studierenden entweder ein gutes oder ein schlechtes Essay vorgelegt. 
Zusätzlich wurde den Proband*innen ein Foto der vermeintlichen (weiblichen) 
Autorin vorgelegt, das entweder eine attraktive Person oder eine unattraktive 
zeigte. Eine weitere Gruppe erhielt keine Informationen über die Attraktivität 
der Verfasserin. Es zeigte sich, dass die guten Essays tatsächlich besser bewertet 
wurden. Zugleich zeigte sich aber auch, dass eine attraktive Verfasserin bessere 
Bewertungen erhielt als eine unattraktive Verfasserin oder eine Verfasserin mit 
unbekanntem Aussehen. 
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In einem Experiment von Shapiro et al. (2007) wurde das vermeintliche 
Gewicht als ein Merkmal von Attraktivität eines Trainees mithilfe von Bil- 
dern manipuliert, bevor ein Training via Gegensprechanlage durchgeführt wurde. 
Dabei zeigte sich, dass vermeintlich übergewichtigen Personen von den Lehr- 
personen mit weniger hohen Erwartungen bezüglich des Trainingserfolgs und 
der Arbeitsmoral begegnet wurde. Außerdem beurteilten die Lehrpersonen das 
Training negativer und zudem weibliche Lehrpersonen die lernende Person nega- 
tiver, wenn sie von einer übergewichtigen Person ausgingen. Müller et al. 
(2017) untersuchten in einem ähnlichen Design wie Glock und Krolak-Schwerdt 
(2013) bzw. Glock (2016) zu ethnischen Stereotypen die Bewertung übergewich- 
tiger Studierender durch Lehramtsanwärter*innen. Dabei zeigte sich entgegen 
den Hypothesen der Autor*innen, dass ein beschriebener übergewichtiger Stu- 
dent in den Leistungs- und Kompetenzdomänen (Mathematik, niederländische 
Sprachfähigkeit, Intelligenz) konstant besser beurteilt wurde als ein beschrie- 
bener normalgewichtiger Student. Müller et al. (2017) erklären diesen Befund 
damit, dass entweder die Lehramtsanwärter*innen keine negativen Stereotype 
gegenüber übergewichtigen Menschen aufgebaut hatten oder dass sie bewusst 
stereotypes Denken kontrollierten. Insgesamt werden trotz einzelner, widerspre- 
chender Befunde jedoch meta-analytisch attraktive Lernende von Lehrpersonen 
akademisch fitter (d = 0.30 bei Dusek & Joseph, 1983; d = 0.36 bei Ritts et al., 
1992) und sozial kompetenter (d = 0.19 bei Dusek & Joseph, 1983; d = 0.48 
bei Ritts et al., 1992) bewertet als unattraktive Lernende. 


9.5 Resümee zu stereotypbasierten 
Lehrendenerwartungen 


Die Darstellung der empirischen Ergebnisse zu stereotypbasierten Lehrendener- 
wartungen konnte an dieser Stelle nur an exemplarischen Studien ausschnitthaft 
und reduziert dargestellt werden. So werden viele Zusammenhänge über ver- 
schiedene moderierende und mediierende Mechanismen erklärt. Beispielsweise 
zeigte sich in der Längsschnittstudie von Sorhagen (2013), dass im sprachli- 
chen Bereich die unzutreffende Lehrendenkompetenzerwartung an Lernende in 
der ersten Klassenstufe die Leistungen in standardisierten Tests im Alter von 
15 Jahren signifikant vorhersagen konnte. Allerdings wurde dieser Zusammen- 
hang vom sozioökonomischen Status (Einkommen der Familie) moderiert, d. h., 
dass der Zusammenhang bei Kindern aus sozioökonomisch schwachen Familien 
größer war. Bei Kindern aus sozioökonomisch starken Familien war der Zusam- 
menhang sehr klein oder kehrte sich bei einigen Tests sogar um, d. h., dass 
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Kinder, die in der ersten Klasse von ihren Lehrkräften unterschätzt wurden, im 
Alter von 15 Jahren besser abschnitten als Kinder, die überschätzt wurden. Für 
den mathematischen Bereich zeigten sich hingegen keine Langzeiteffekte. 
Resümierend kann festgehalten werden, dass Leistungserwartungen auf Basis 
von Stereotypen existieren, die aber nicht bei jeder Lehrperson in jeder Situation 
zum Tragen kommen. In der Regel ist der Zusammenhang zwischen Gruppen- 
zugehörigkeit der Lernenden und Leistungserwartungen der Lehrpersonen an die 
Lernenden eher klein (Geschlecht, ethnische Minoritätszugehörigkeit) bis mode- 
rat (Attraktivität, sozioökonomischer Status, ethnische Minoritätszugehörigkeit). 
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Die Lehrperson als Golem oder 1 0 
Galatea – Quellen der Erwartungen 


Das transaktionale Modell von Nickel (1985) beschreibt die Lehr-Lern- 
Interaktion als gegenseitige Wechselwirkung. Somit haben theoretisch auch die 
(Kompetenz-)Erwartungen der Lernenden an Lehrpersonen einen Einfluss auf das 
Lernen und Lehren. Befunde zu Lehrenden(kompetenz)erwartungen und deren 
Quellen sind, wie bereits ausgefiihrt, zahlreich. Doch wie werden Lehrpersonen 
wahrgenommen? Im Rahmen des stereotype content model (s. Kapitel 5) werden 
Lehrpersonen zumeist mittelhoch bis hoch warm beschrieben (Carlsson, 2013; 
Cuddy et al., 2009; Eckes, 2002; Lehramtsstudierende s. Ihme & Möller, 2015). 
Teilweise werden Lehrpersonen als wenig(er) kompetent bezeichnet (Carlsson, 
2013; Imhoff et al., 2013; Lehramtsstudierende s. Ihme & Möller, 2015), teil- 
weise als kompetent (Cuddy et al., 2009; Eckes, 2002). Professor*innen werden 
in der Regel sowohl hoch kompetent als auch hoch warm beurteilt (Eckes, 2002). 
Somit gibt es Situationen und Lehrkontexte, in denen eine Lehrperson als Golem 
(geringe Kompetenzzuschreibung) oder Galatea (hohe Kompetenzzuschreibung) 
beschrieben werden kann. 

Lernendenerwartungen an Lehrpersonen können durch unterschiedliche 
Mechanismen aufgebaut werden. Feldman und Prohaska (1979) listen auf, dass 
Erwartungen durch physische Attraktivität, Geschlecht, Ethnie und Verhaltensei- 
genarten der Lehrpersonen entstehen sowie durch Informationen von Geschwis- 
tern oder Freund*innen oder durch Gerüchte. Eine Reihe von Faktoren aufseiten 
der Lernenden, der Lehrpersonen und der Situation werden diskutiert (vgl. 
Casero, 2010). Wie auch bei den Lehrendenerwartungen (s. Kapitel 9) können 
Stereotype gegenüber Lehrpersonen zur Ausbildung von Lernendenerwartungen 
wirksam werden. 
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10.1 Geschlecht 


Hinsichtlich des Geschlechts einer Lehrperson ist die Befundlage recht wider- 
sprüchlich und inkonsistent, was auch auf unterschiedliche Messinstrumente zur 
Bewertung und Evaluation der (vermeintlichen) Kompetenz zurückzuführen ist. 
Bei Joye und Wilson (2015) spiegelt sich bei der Bewertung von Professor*innen 
das klassische Geschlechtsstereotyp wider. So wurden Männer als bessere Erklä- 
rer (also kompetenter) und Frauen besser im Beziehungsaufbau (also wärmer) 
beschrieben. Dabei spielte das von der lernenden Person angenommene und 
nicht das tatsächliche Geschlecht eine Rolle. In einer Studie von MacNell et al. 
(2015) wurden das tatsächliche Geschlecht und das erwartete Geschlecht einer 
Lehrperson in einem Online-Kurs systematisch variiert. Dabei zeigte sich, dass 
das tatsächliche Geschlecht der Lehrperson keinen Einfluss auf die studentische 
Bewertung des Unterrichts und der Lehrperson hat. Das erwartete, angenommene 
Geschlecht der Lehrperson hatte hingegen einen Einfluss auf die Bewertung: So 
wurden vermeintlich männliche Lehrpersonen positiver bewertet als weibliche. 
Ein Einfluss des Geschlechts der Studierenden zur Überprüfung der Eigengrup- 
penbevorzugung (Balliet et al., 2014; DiDonata et al., 2011; Robbins & Krueger, 
2005) wurde hingegen nicht kontrolliert. 

Insgesamt zeigt sich in einigen Studien, dass weibliche Lehrpersonen kom- 
petenter und positiver bewertet werden (Bennet, 1982; Griffin, 2001; Martin & 
Smith, 1990; Romano & Bordieri, 1989; Sohr-Preston et al., 2016; Wigington 
et al., 1989), andere Studien zeigen, dass Männer besser beurteilt werden (ins- 
besondere, wenn gleichzeitig als sympathisch resp. warm beurteilt; Basow & 
Silberg, 1987; Meltzer & McNulty, 2011; Nadler et al., 2013) und eine 
dritte Gruppe von Studien konnte keine signifikanten (Haupt-)Effekte für das 
Geschlecht ausmachen (Basow et al., 2013; Bavishi et al., 2010; Goebel & 
Cashen, 1979; Riniolo et al., 2006). In einer Untersuchung von Basow et al. 
(2006) nominierten Studierende zu 71 % einen männlichen Inhaber einer Profes- 
sur als beste Lehrperson und zu 66 % eine weibliche Inhaberin einer Professur als 
schlechteste Lehrperson. Die meisten diesbezüglichen Studien fokussieren dabei 
auf die Hochschullehre bzw. die Beurteilung von Hochschullehrenden, was sich 
nicht ohne Weiteres auf andere Bildungskontexte übertragen lässt. So bewerteten 
Kinder bei Mancus (1992) weibliche Lehrkräfte kompetenter als männliche. 

In der Zusammenschau aller rezipierten Studien werden weibliche Lehrper- 
sonen tendenziell besser und kompetenter beurteilt als männliche. Die bessere 
Bewertung kann nach Griffin (2001) darauf zurückgeführt werden, dass zumeist 
Frauen für die Bewertung befragt werden und sich somit eine Eigengruppenbe- 
vorzugung (Balliet et al., 2014; DiDonata et al., 2011; Robbins & Krueger, 2005) 
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zeigt, die jedoch nicht immer ausgemacht werden kann (u. a. Basow et al., 2013). 
Außerdem bewerten weibliche Dozierende tendenziell milder (u. a. Nadler et al., 
2013), was wiederum zu einer besseren Evaluation führen kann. 


10.2 Ethnie und Migrationshintergrund 


Wie bei den Erwartungen an Lernende kann auch der ethnische Hintergrund 
einer Lehrperson Lernendenerwartungen an die Lehrperson induzieren. Die 
empirischen Befunde sind auch nicht eindeutig und im Vergleich zu geschlechts- 
bezogenen Unterschieden eher rar. 

Hinsichtlich der Kompetenzbewertung befragten Bavishi et al. (2010) High 
School-Schüler*innen, wie sie Professor*innen bewerten. Dafür sollten sie sich 
vorstellen, während des Studiums als Assistent*in für eine*einen Professor*in 
zu arbeiten. Die Bewertung basierte auf einem fiktiven Lebenslauf, in dem u. а. 
die Ethnie (afrikanisch, asiatisch oder kaukasisch) systematisch variiert wurde. 
Die vermeintlich afroamerikanischen Professor*innen wurden weniger kompetent 
bewertet als die asiatisch-amerikanischen (Asian American) und kaukasischen, 
die Bewertungen der Letzteren unterschieden sich nicht. Bei Basow et al. (2013) 
erhielten hingegen afroamerikanische Professor*innen dezent bessere Bewertun- 
gen als kaukasische. Glascock und Ruggiero (2006) zeigten wie Bavishi et al. 
(2010) für Afroamerikaner*innen, dass hispanoamerikanische Professor*innen 
negativer bewertet werden als angloamerikanische. Im Vergleich beziiglich der 
Kompetenz (capability) mit lateinamerikanischen Lehrpersonen schnitten anglo- 
amerikanische bei Anderson und Smith (2005) hingegen nicht vorteilhafter ab; 
es zeigte sich kein Haupteffekt. Insgesamt scheint also zumeist die Ethnie der 
Majorität (in den hier zitierten US-amerikanischen Studien die kaukasischen, 
angloamerikanischen Lehrpersonen) positiver bewertet zu werden. 


10.3 Physische Attraktivität 


Attraktive (sexuell anziehende, hot) Lehrpersonen werden fast durchgehend posi- 
tiver bewertet und evaluiert (Bonds-Raacke & Raacke, 2007; Goebel & Cashen, 
1979; Liu et al., 2013; Riniolo et al., 2006). Liu et al. (2013) beschrieben, dass 
der Effekt für weibliche Probandinnen größer war als für männliche Probanden. 
Lediglich bei Sohr-Preston et al. (2016) erhielten attraktive Dozierende geringere 
Werte bezüglich der Bewertung der Klarheit und ansonsten gleiche Beurteilungen. 
Romano und Bordieri (1989, S. 1099) resümieren: 
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Analyses showed that attractive professors were (a) seen as better teachers, (b) per- 
ceived as more likely to be asked for additional assistance, (c) more likely to be 
recommended to other students, and (d) less likely to be blamed if a student received 
a failing course grade than unattractive professors. 


10.4 Gerüchte und Reputation 


Neben den stereotypbasierten Quellen für (Kompetenz-)Erwartungen sind auch 
Gerüchte und die Reputation bedeutsam. So können im schulischen Kon- 
text Informationen zu Lehrkräften von Freund*innen und/oder den Geschwis- 
tern kommen. Stärker von Bedeutung für den Hochschulbereich sind Online- 
Bewertungsportale. 

Einige experimentelle Studien manipulierten die Kompetenzerwartungen an 
Lehrpersonen via vorheriger Kommentare nach dem Muster von RateMyProfes- 
sors.com. Anschließend sollten die Proband*innen eine videografierte Lehrperson 
beurteilen. Die Kompetenzmanipulation beeinflusste die Beurteilung der Lehr- 
personen und des Unterrichts in die zur Manipulation kongruente Richtung 
(Lewandowski et al., 2012; Reber et al., 2017). 

Bei Wigington et al. (1989) zeigten sich u. a. die Reputation resp. das Ansehen 
und die berufliche Position (Rang) der dozierenden Person als Prädiktoren für die 
Bewertung der Lehrperson in Lehrevaluationen. Während eine hohe Reputation 
mit besseren Evaluationen einherging, wurden Lehrassistent*innen sowie Pro- 
fessor*innen schlechter bewertet als Assistenz- und assoziierte Professor*innen. 
Der Einfluss der Reputation zeigte sich auch bei Tollefson und Wigington (1986) 
sowie bei Griffin (2001). 
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Wirkungen von 1 1 
Lernendenkompetenzerwartungen 
an Lehrpersonen 


Wie aufgezeigt, speisen sich die Lernendenkompetenzerwartungen (kognitives 
Schema nach Nickel, 1985) an Lehrpersonen aus unterschiedlichen Quellen (des 
soziokulturellen Bezugsrahmens, Nickel, 1985). Diese Erwartungen wirken sich 
nach dem transaktionalen Modell von Nickel (1985; s. Kapitel 7) sowohl auf das 
Erleben und Verhalten der Lernenden selbst aus als auch auf die Lehrpersonen 
(s. Abbildung 7.1). 


11.1 Bewertung der Lehrpersonen 


Ein Bereich, der augenscheinlich im Zusammenhang mit den Lernendenkom- 
petenzerwartungen an Lehrpersonen stehen sollte, ist die Evaluation und die 
Bewertung der Lehrpersonen. Dies wird auch durch die empirische Befundlage 
gestützt. 

So zeigten Terry und McIntosh (1988), dass der erste Eindruck eines Kur- 
ses inklusive des ersten Eindrucks von der Lehrperson mit der Evaluation sechs 
und zwölf Wochen später zusammenhängen. Für den angenommenen Lernerfolg 
(amount learned) zeigten sich keine Zusammenhänge zwischen dem ersten Ein- 
druck und der späteren Evaluation, jedoch zwischen Evaluationen in der sechsten 
und zwölften Woche. Interessant ist, dass sich für die Lehr-Lern-Interaktion 
(teacher’s concern, methods of criticizing and correcting students, extent to 
which teacher motivates students) zu allen drei Messzeitpunkten signifikante 
Zusammenhänge fanden. 
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In experimentellen Studien, in denen die Lernendenkompetenzerwartungen 
durch Fallvignetten variiert wurden, zeigte sich, dass die spätere Bewertung 
der Lehrperson kompetenter, sympathischer und motivierter ausfallt, wenn die 
Proband*innen glaubten, sie hätten es mit einer vermeintlich kompetenten 
Lehrperson zu tun (Feldman & Prohaska, 1979; Feldman & Thiess, 1982; Lewan- 
dowski et al., 2012; Perry et al., 1979; Reavis, 1979; Reber et al., 2017; Towler & 
Dipboye, 2006). Die Effekte variieren allerdings je nach betrachteter Dimension. 
Haefele (1988) ließ Studierende videografierte Lehrkräfte (in einer 5. oder einer 
11. Klasse) bewerten, von denen entweder behauptet wurde, sie wären kompetent 
(Galatea-Bedingung) oder nicht kompetent (Golem-Bedingung). Im Fokus stand 
dabei die Bewertung der Klarheit und Verständlichkeit. Haefele (1988) konnte 
jedoch keine signifikanten Unterschiede zwischen der Golem- und der Galatea- 
Bedingung berichten, wenngleich deskriptiv die Unterschiede in die erwartete 
Richtung gingen. Auch Towler und Dipboye (2006) fanden keine Unterschiede 
bezüglich der Klarheit, Feldman und Theiss (1982) hingegen konnten einen 
signifikanten Effekt ausmachen. 

Leventhal et al. (1977) untersuchten Kompetenzerwartungen im Kontext der 
Qualität der Lehre. Sie zeigten Proband*innen entweder ein Video eines guten 
oder eines schlechten Vortrags. Vorher wurde die Kompetenzerwartung über 
die Beschreibung der Lehrperson als erfahren oder unerfahren manipuliert. 
Das Ergebnis zeigte einen Haupt- und einen Interaktionseffekt: Gute Vorträge 
erzielten insgesamt die positivsten Ergebnisse. Innerhalb der guten Vorträge 
wurden vermeintlich Unerfahrene schlechter in der allgemeinen Fähigkeit bewer- 
tet als Erfahrene. Kein Unterschied ergab sich zwischen den Bedingungen der 
schlechten Vorträge. 


11.2 Erleben und Verhalten der Lernenden 


Haben Lernende eine Erwartung an Lehrpersonen ausgebildet, dann beeinflusst 
diese auch sie selbst und dies in unterschiedlichster Weise. Feldman und Prohaska 
(1979, Studie 1) manipulierten die Kompetenzerwartung in einer dyadischen 
Lehr-Lern-Interaktion in einer Laborstudie, die auf Video aufgezeichnet wurde. 
In der einen Bedingung wurde behauptet, die Lehrperson (Konföderierte) sei 
kompetent und freundlich (Galatea-Bedingung), in der anderen, dass die Lehr- 
person inkompetent und uneffektiv sei (Golem-Bedingung). Dabei zeigten sich 
folgende Ergebnisse: Die Lernenden der Golem-Bedingung fanden (1.) den 
Unterricht schwieriger, (2.) den Unterricht weniger interessant und (3.) effektiv, 
(4.) die Lehrperson weniger kompetent, (5.) intelligent, (6.) enthusiastisch und 
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(7.) sympathisch als die Lernenden der Galatea-Bedingung. Weiterhin zeigten sie 
(8.) keine signifikant schlechtere Leistung bei Merkaufgaben (paired associates), 
(9.) die Lernenden schnitten jedoch schlechter bei einem Multiple-Choice-Test 
ab. (10.) Im Gesamten zeigte sich ein statistischer Trend für das nonverbale 
Verhalten der Lernenden: In der Galatea-Bedingung waren die Lernenden der 
Lehrperson zugewandter (immediacy). Im Einzelnen gab es einen signifikan- 
ten Unterschied bezüglich des Vorbeugens und einen Trend beim prozentualen 
Blickkontakt (jeweils stärkere Ausprägung in der Galatea-Bedingung). Statistisch 
nicht signifikant waren die Distanz zur Lehrperson und die seitliche Orientie- 
rung (Linie zwischen Schultern der Versuchsperson im schrägen Winkel (somit 
nicht im rechten Winkel) zur Linie zwischen den Köpfen der Versuchsperson und 
konföderierten Lehrperson; s. Abbildung 11.1). 
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Anmerkungen. Aus der Vogelperspektive stehen sich zwei Personen gegenüber, bei a ist die 
Orientierung zugewandter als bei b. 


Abbildung 11.1 Schematische Darstellung der seitlichen Orientierung 


In einer Feldstudie von Jamieson et al. (1987) wurde in zwei Klassen eine 
positive Erwartung hinsichtlich Kompetenz und Motivation an eine Lehrkraft 
induziert, zwei weitere Klassen ohne Erwartungsmanipulation dienten als Kon- 
trollgruppe. Es zeigte sich, dass die Schüler*innen in der Experimentalgruppe 
nach der dreiwöchigen Unterrichtseinheit höhere akademische Leistungen erziel- 
ten als die der Kontrollgruppe. Da einige Schüler*innen sieben Tage nach der 
Kompetenzmanipulation auf Video aufgenommen wurden, Konnte auch das non- 
verbale Verhalten der Kinder ausgewertet werden. Dabei zeigte sich, dass die 
Schüler*innen in der Experimentalgruppe mehr positives, erwünschtes (z. B. 
Ausführen der Arbeitsaufträge) und weniger negatives, unerwünschtes Verhal- 
ten (z. B. Unterhaltungen mit Banknachbar*innen) zeigten als die Kinder der 
Kontrollgruppe. 
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In einigen Studien zeigte sich analog zum selbstgesteuerten Lernen mit Com- 
puterprogrammen (Fries et al., 2006; vgl. Haimerl & Fries, 2010) ein Lernvorteil, 
wenn eine kompetente Lehrperson erwartet wird (Adediwura & Tayo, 2007; 
Edwards et al., 2009; Jamieson et al., 1987; Reber et al., 2017). In anderen 
Studien ergab sich allerdings kein Unterschied zugunsten einer hohen Lernen- 
denkompetenzerwartung an eine Lehrperson (Lewandowski et al., 2012; Perry 
et al., 1979; Towler & Dipboye, 2006) und in wieder anderen nur unter bestimm- 
ten Bedingungen (z. B. bei einzelnen Testverfahren; Feldman & Prohaska, 1979; 
nur bei schlechten Vorträgen, Leventhal et al., 1977) oder marginal signifikant 
(Feldman et al., 1983). Weitergehend fanden Lernende, die eine hohe Kompeten- 
zerwartung an eine Lehrperson hatten, den Unterricht interessanter (Feldman & 
Prohaska, 1979; Feldman & Theiss, 1982), hatten einen positiveren Affekt 
(der den Zusammenhang zwischen Kompetenzerwartung und Leistung teilweise 
mediiert; Edwards et al., 2009) und waren eher bereit, an einer potenziellen 
Lehrveranstaltung teilzunehmen (Kowai-Bell et al., 2011, 2012). Zusammenfas- 
send stehen Lernendenkompetenzerwartungen an Lehrpersonen mit zugewandtem 
Verhalten und einem positiven Erleben der Lehre im Zusammenhang. 


11.3 Effekte von Lernendenkompetenzerwartungen 
an Lehrpersonen auf die Lehrpersonen 


Das von den Lehrpersonen wahrgenommene Lernendenverhalten hängt mit dem 
Erleben der Lehrpersonen in der Lehr-Lern-Situation zusammen. So steht die 
Wahrnehmung von Engagement, Disziplin und einer guten Beziehung im Zusam- 
menhang mit der Selbstwirksamkeit, der Freude, der Angst und Frustration bei 
Lehrpersonen (Hagenauer et al., 2015). Wie sich die Lernendenkompetenzer- 
wartungen auf die Lehrpersonen auswirken, ist bisher kaum gezielt empirisch 
untersucht, dennoch konnten einige wenige Erkenntnisse gewonnen werden. 
Bei Kowai-Bell et al. (2012) sollten sich Dozierende in eine auf RateMy- 
Professors.com bewertete Person hineinversetzen. Dabei ergab sich, dass das 
Hineinversetzen in eine gut bewertete Person im Vergleich zu einer schlecht 
bewerteten Person dazu führte, dass die Dozierenden stärker daran glaubten, dass 
Studierende sie mochten, dass sie mehr Selbstvertrauen im Umgang mit Stu- 
dierenden in der Zukunft berichteten und einen positiveren Affekt erlebten. Kein 
Einfluss hingegen zeigte sich bezüglich des Vertrauens in die eigenen Fähigkeiten. 

Nachdem Feldman und Prohaska (1979, Studie 1) zeigten, dass sich Lernende 
in Abhängigkeit ihrer Kompetenzerwartungen an die Lehrpersonen unterschied- 
lich verhielten, betrachteten sie die Auswirkungen der ausgemachten Verhaltens- 
muster auf die Lehrpersonen (Studie 2). Das nonverbale Verhalten der Lernenden 
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wurde von einer Konföderierten systematisch anhand der Ergebnisse der ers- 
ten Studie manipuliert. In der Galatea-Bedingung saßen die Konföderierten 
näher an den lehrenden Probandinnen (nur Frauen), beugten sich weiter nach 
vorn und hatten mehr Blickkontakt als Konföderierte der Golem-Bedingung. 
Außerdem saßen die Konföderierten der Galatea-Bedingung gerade ausgerichtet 
und die Konföderierten der Golem-Bedingung hatten eine eingedrehte Hal- 
tung (s. Abbildung 11.1). Die Effektstärken, die sich zwischen der Golem- 
und Galatea-Bedingung ergaben, sind in Abbildung 11.2 dargestellt. Die leh- 
renden Probandinnen fanden sich in der Galatea-Bedingung (1.) fröhlicher, 
(2.) wärmer und (3.) weniger unzufrieden mit sich selbst als die lehrenden 
Versuchspersonen der Golem-Bedingung. Die Lernenden wurden in der Golem- 
Bedingung (4.) weniger enthusiastisch und (5.) sympathisch durch die lehrenden 
Probandinnen eingeschätzt als in der Galatea-Bedingung. Beim nonverbalen Ver- 
halten der Versuchspersonen gab es keine signifikanten Unterschiede. (6.) Zwei 
untrainierte Beobachtende, die jeweils nur 20 Sekunden einer Unterrichtseinheit 
auf einem Video sahen, bewerteten die lehrenden Probandinnen der Galatea- 
Bedingung in ihrem Verhalten signifikant adäquater als die Teilnehmenden der 
Golem-Bedingung. Ähnliches zeigte sich bei einer Manipulation der Erwartun- 
gen aufseiten der Lernenden hinsichtlich der Wärme (warm oder kalt; Herrell, 
1971). In der Warm-Bedingung wurde die Lehrperson am Ende eines Vortrags 
allgemein positiver von unabhängigen Beurteiler*innen bewertet als in der Kalt- 
Bedingung, was auf einen Einfluss der Erwartungsmanipulation auf das Verhalten 
der Lehrpersonen schließen lässt. 

Mottet et al. (2004) untersuchten auch die Wirkung des nonverbalen Ver- 
haltens der Lernenden auf die Wahrnehmung von Lehrpersonen: Lehrpersonen 
als Studienteilnehmende sollten sich ein Video ansehen, das Lernende aus der 
Perspektive der Lehrperson zeigte. Anschließend sollten die Proband*innen ange- 
ben, wie sehr sie die Lernenden mochten und inwieweit sie gewillt waren, 
Wünschen der Lernenden nachzugeben (z. B. Fristverlängerungen). Die Videos 
unterschieden sich einerseits auf Basis der verbalen Aktivität der Lernenden 
(z. B. stellten sie viele Fragen) und im nonverbalen Verhalten der Lernen- 
den. So zeigten die Lernenden entweder freundliches und zugewandtes (z. B. 
Lächeln, Blickkontakt, aufrechte Haltung) oder ein abgewendetes Verhalten (z. B. 
neutraler Gesichtsausdruck, wenig Blickkontakt). Es zeigte sich, dass nur das 
nonverbale Verhalten einen Einfluss auf die berichtete Sympathie (liking; 66 % 
erklärte Varianz) und Bereitschaft, Wünschen nachzugeben (31 % erklärte Vari- 
anz), hatte. Mottet et al. (2004) konnten also auch mit einem videobasierten 
Experiment die Bedeutsamkeit des nonverbalen Verhaltens von Lernenden in der 
Lehr-Lern-Interaktionsgestaltung aufzeigen. 
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Anmerkungen. Positive Werte kennzeichnen einen höheren Wert für die Galatea-Bedingung 
(N = 24) und negative Werte einen höheren Wert für die Golem-Bedingung (N = 16). 
Schwarze Balken: Selbstbewertung der Lehrpersonen; dunkelgraue Balken: Bewertung der 
Lernenden durch die Lehrpersonen; hellgraue Balken: nonverbales Verhalten der 
Lehrpersonen gegenüber den Lernenden; weiße Balken: Fremdbewertung der 
Lehrpersonen. * p < .05. 


Abbildung 11.2 Effektstärken bei Feldman und Prohaska (1979) 


Feldman und Theiss (1982) manipulierten ähnlich wie Feldman und Pro- 
haska (1979) Erwartungen, aber parallel die Erwartungen der Lehrpersonen (an 
die Lernenden) und die der Lernenden (an die Lehrpersonen). Die Haupteffekte 
der Manipulation der Lehrendenkompetenzerwartung replizierte weitestgehend 
Ergebnisse zum Pygmalion-Effekt. Ein Effekt der Lernendenkompetenzerwar- 
tung auf die von drei Ratern durchgefiihrte Leistungsbewertung der Lehrperson 
wurde nicht signifikant. Außerdem äußerten die Proband*innen keine Unter- 
schiede bezüglich der Einstellung der Lehrpersonen zum Unterricht oder zu den 
Lernenden: „Although the data reveal that teacher expectations about the student 
were communicated to the student, resulting in differential student performance, 
the results do not indicate that student expectations about the teacher were 
transmitted to the teacher“ (Feldman & Theiss, 1982, S. 222-223). Weiterge- 
hend konnten Feldman und Theiss (1982) bei paralleler Erwartungsinduktion bei 
Lehrpersonen und Lernenden keine signifikanten Interaktionseffekte ausmachen. 

Insgesamt zeigen sich also, sofern Unterschiede ausgemacht werden, ähnliche 
Phänomene wie bereits beim Pygmalion-Effekt (Rosenthal & Jacobson, 1966, 
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1971; vgl. Nickel, 1985), wenn die Erwartungen von Lernenden an Lehrper- 
sonen variieren. Im Modell von Nickel (1985; s. Abbildung 7.1) lassen sich 
diese Befunde analog zu den Befunden der Lehrendenerwartungen einsortie- 
ren: Die Lernendenkompetenzerwartungen (als kognitive Schemata) entstehen auf 
Basis unterschiedlicher Informationen vor dem Hintergrund des soziokulturellen 
Bezugsrahmens, z. B. durch Stereotype, Bewertungen von anderen (u. a. Online- 
Portale) oder in Studien durch Versuchsleitungen. Die Kompetenzerwartungen 
führen dann zu einem angepassten Verhalten der lernenden Person, also bei hohen 
Kompetenzerwartungen zu einem zugewandteren und störungsärmeren Verhal- 
ten (Feldman & Prohaska, 1979; Jamieson et al., 1987). Dieses Verhalten wird 
von der Lehrperson wahrgenommen und in eigene Schemata in Bezug auf die 
lernende Person eingebaut (interaktionales Schema; Thies, 2010), die sich wie- 
derum in eigenem Erleben und Verhalten widerspiegeln. Beispielsweise reagieren 
Lehrpersonen auf positive Lernendenkompetenzerwartungen mit mehr positiven 
und weniger negativen Emotionen, sie sind motivierter und werden effektiver im 
Verhalten eingeschätzt (Feldman & Prohaska, 1979). Somit können Lernendener- 
wartungen sowohl Ausgangspunkt für positive (Galatea-Effekt) als auch negative 
Lehr-Lern-Interaktionsmuster (Golem-Effekt) sein. 

Die Ebene der Analysen ist bei den zitierten Studien zu den Lernenden- 
erwartungen jedoch unterschiedlich: Einige fokussierten Erwartungen einzelner 
Lernender (u. a. Adediwura & Tayo, 2007; Feldman & Prohaska, 1979; Feld- 
man & Theiss, 1982), darunter in medienbasierten Lernarrangements (u. a. Fries 
et al., 2006; Haimerl & Fries, 2010), andere Erwartungen von Lernendengrup- 
pen (Hagenauer et al., 2015; Herrell, 1971; Jamieson et al., 1987). Zumeist wird 
auf die unterschiedlichen Ebenen nicht eingegangen, aber bereits Leventhal et al. 
(1977) wiesen auf die Problematik der Analyse-Einheiten hin, also ob einzelne 
Lernende oder Gruppenwerte (session means) betrachtet werden sollten. Jamie- 
son et al. (1987) diskutierten explizit, dass Lernendenerwartungen mehr Einfluss 
auf Lehrpersonen haben sollten, wenn die Erwartungen der Lernenden ähnlich 
sind — im Vergleich zu nicht geteilten, unterschiedlichen Lernendenerwartungen 
an Lehrpersonen. Statistisch wurde in keiner der Untersuchungen zwischen einem 
Einfluss auf Individual- und auf Gruppenebene unterschieden. 

Im Modell von Nickel (1985) wird die Lehr-Lern-Interaktion zwischen einer 
lehrenden und einer lernenden Person beschrieben. Die Lernendengruppe, z. B. 
die Gesamtheit der Schüler*innen einer Klasse, wird nicht als Entität benannt, 
spielt aber im soziokulturellen Bezugsrahmen als gegenwärtige Beziehung hin- 
ein. Die Gruppendynamik innerhalb von Lehr-Lern-Gruppen ist hochkomplex und 
nicht-linear (Knierim et al., 2017; Koopmans & Stamovlasis, 2016; Perrez et al., 
2006; Thies, 2017). So können sich Lernende an dem Verhalten von anderen 
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Lernenden orientieren und sich anpassen, sich den Gruppennormen widerset- 
zen, das Gruppenklima auf die Kompetenz der Lehrpersonen zurückführen usw. 
(vgl. Jamieson et al., 1987) — auch Gruppenpolarisationsprozesse (vgl. Myers & 
Lamm, 1976) in Bezug auf die Lernendeneinschätzungen der Lehrkompetenz sind 
denkbar. Deswegen sollten bei Untersuchungen in Lehr-Lern-Settings sowohl die 
Individual- als auch die Gruppenebene betrachtet werden. 
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Wie aufgezeigt, ist die Lehr-Lern-Interaktion und -Beziehung komplex und dyna- 
misch (Knierim et al., 2017; Koopmans & Stamovlasis, 2016; Perrez et al., 
2006; Thies, 2017; s. Kapitel 1) sowie wesentlich fiir erfolgreiches Lehren 
und Lernen. Auch Hattie (2015) beschreibt die Lehr-Lern-Beziehung als eine 
der bedeutsamsten Variablen fiir die Lernendenleistungen und -einstellungen 
(Rang 11). Unterschiedliche theoretische Ansätze zeigen die Komplexität der 
Lehr-Lern-Interaktion auf (vgl. Thies, 2017). Ein relevanter Faktor, der die 
Lehr-Lern-Interaktion beeinflussen kann, sind Erwartungshaltungen (s. Kapitel 3). 

Eine besondere Form von Erwartungshaltungen wurde als Pygmalion-Effekt 
von Rosenthal und Jacobson (1966, 1971) beschrieben, was zu einer Reihe 
von Untersuchungen von Erwartungseffekten in Lehr-Lern-Situationen führte (s. 
Kapitel 6). Dabei wurden insbesondere interpersonale, fremdbezogene Kompe- 
tenzerwartungen von Lehrpersonen an Lernende betrachtet — sowohl in positiver 
(Galatea-Effekt) als auch in negativer Richtung (Golem-Effekt). Nach dem 
stereotype content model (u. a. Fiske et al., 1999; s. Kapitel 5) ist die Kom- 
petenzbeurteilung neben der Wärmebeurteilung eine zentrale Dimension bei der 
sozialen Wahrnehmung, die die Lehr-Lern-Interaktion beeinflussen kann. In vie- 
len Studien wurden experimentelle Designs eingesetzt, um den Einfluss der 
Kompetenzerwartungen auszumachen. Außerhalb des Labors, in „natürlichen“ 
Lehr-Lern-Kontexten können Kompetenzerwartungen auf verschiedenen Informa- 
tionen beruhen. So zeigen sich stereotypbasierte Verzerrungen der Lehrenden- 
kompetenzerwartungen z. B. auf Basis von Geschlecht, ethnischem Hintergrund 
und sozioökonomischem Status der Lernenden (s. Kapitel 9). 

Modelle der Lehr-Lern-Interaktion sehen allerdings nicht nur Lehrperso- 
nen, sondern auch Lernende als aktive Gestaltende der Unterrichtssituation und 
der Beziehung zu den Lehrpersonen. Das transaktionale Modell von Nickel 
(1985; s. Kapitel 7) beschreibt eine zirkuläre Wechselwirkung der Lehrpersonen 
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und Lernenden, die durch individuelle kognitive Schemata, darunter Erwar- 
tungshaltungen, geprägt ist. Allerdings sind Lernendenkompetenzerwartungen an 
Lehrpersonen in der pädagogisch-psychologischen Forschung kaum adressiert 
und fokussieren meist die Auswirkungen auf die Lernenden selbst. Lediglich 
zwei (englischsprachige) Studien beschreiben die Wirkung von Lernendenkom- 
petenzerwartungen auf das Erleben und Verhalten von Lehrpersonen (Feldman & 
Prohaska, 1979; Feldman & Theiss, 1982), die jedoch zu unterschiedlichen 
Ergebnissen gelangen. 

Das Anliegen dieser Arbeit ist es daher, die Lernendenkompetenzerwartungen 
an Lehrpersonen empirisch in den Mittelpunkt zu stellen. Dabei soll nicht nur die 
Entstehung von Kompetenzerwartungen, sondern auch die Wirkung der Erwar- 
tungen auf die Lernenden selbst sowie auf die Lehrpersonen fokussiert werden. 
Dieses Anliegen führt auf Basis des transaktionalen Modells von Nickel (1985) 
zu drei übergeordneten Fragestellungen: 


1. Wie stark werden Lernendenkompetenzerwartungen an Lehrpersonen durch 
(Geschlechts-)Stereotype bestimmt? 

2. Wie wird das nonverbale Verhalten von Lernenden in Abhängigkeit von den 
Lernendenkompetenzerwartungen an Lehrpersonen beeinflusst? 

3. Wie wirken initiale Lernendenkompetenzerwartungen an Lehrpersonen auf die 
Wahrnehmung der Lehr-Lern-Situation — sowohl bei Lernenden als auch bei 
Lehrpersonen? 


Um diese Fragestellungen zu untersuchen, werden vier empirische Studien 
durchgeführt (s. Abbildung 12.1). Die Studien 1 und 2 fokussieren die erste 
Fragestellung. In diesen werden mithilfe von Fallvignetten die kognitiven Reprä- 
sentationen hinsichtlich der Kompetenz von schulischen Lehrkräften in Abhän- 
gigkeit von Geschlecht (Studie 1 und 2), Unterrichtsfach (Studie 1 und 2) 
und Schulform (Studie 2) fokussiert. Es wird davon ausgegangen, dass sich 
Geschlechtsstereotype, die durch den soziokulturellen Bezugsrahmen geprägt 
werden, in den Kompetenzbeurteilungen widerspiegeln: Basierend auf bisheri- 
gen Befunden zu Geschlechts-Professions-Assoziationen (Guimond & Roussel, 
2001; Miller et al., 2018; Nosek et al., 2009; Plante et al., 2009; Smyth & 
Nosek, 2015; Su et al., 2009), sollten Frauen als Lehrkraft in für die Schule rela- 
tiv „feminin“ angesehenen Bereichen des Unterrichts (Unterrichtsfach Deutsch; 
Schulform Grundschule) und Männer in relativ „maskulin“ angesehenen Berei- 
chen (Unterrichtsfach Mathematik; Schulform Gymnasium) kompetenter beurteilt 
werden. 
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Abbildung 12.1 Überblick über die Studien in Anlehnung an das transaktionale Modell 
von Nickel (1985) 


Studie 3 zielt auf die zweite Fragestellung. Der Pygmalion-Effekt bei Leh- 
rendenkompetenzerwartungen wurde bereits bei Rosenthal und Jacobson (1966, 
1971) dadurch erklärt, dass sich die Erwartungen im Verhalten der Lehrkräfte 
widerspiegeln. Diese Erklärung kann mit zahlreichen empirischen Studien (vgl. 
u. a. Harris & Rosenthal, 1985) Bestätigung finden. Die Befundlage zu den 
Auswirkungen von Lernendenkompetenzerwartungen auf das Lernendenverhal- 
ten sind rar und bereits über 30 Jahre alt (Feldman & Prohaska, 1979; Jamieson 
et al., 1987). In der Studie 3 werden deswegen im experimentellen Laborsetting 
die Kompetenzerwartungen an eine Lehrperson manipuliert. Auf Basis von video- 
grafierten Situationen werden ausgewählte Aspekte des nonverbalen Verhaltens in 
Abhängigkeit einer Kompetenzmanipulation überprüft. 

Verschiedene weitere Zusammenhänge mit den Kompetenzerwartungen Ler- 
nender werden in der Studie 4 (zur dritten Fragestellung) in einer Feldstudie 
fokussiert. Dabei wird von den Lernenden der erste Eindruck, den sie von der 
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Lehrperson hatten, erfasst und dieser mit der Wahrnehmung des eigenen Erle- 
bens und Verhaltens (a, Abbildung 12.1) sowie der Bewertung der Lehrperson 
innerhalb einer Lehrveranstaltung in Verbindung gebracht (b, Abbildung 12.1). 
Diese Betrachtungen sollen bisherige Befunde zur Auswirkung der Lernen- 
denkompetenzerwartungen auf die Lernenden selbst replizieren, jedoch unter 
Berücksichtigung sowohl der Individual- als auch der Gruppenebene (s. Kapi- 
tel 11). Zusätzlich wird der in der bisherigen Forschung vernachlässigte Aspekt 
der Wirkung auf die Lehrpersonen, die bisher nur von Feldman und Prohaska 
(1979) sowie Feldman und Theiss (1982) untersucht wurde, empirisch überprüft 
(c, Abbildung 12.1). Da Feldman und Prohaska (1979) sowie Feldman und Theiss 
(1982) die Wirkung mit experimentellen Laborsettings sowie dyadischen Lehr- 
Lern-Interaktionen untersuchten, soll erweiternd und ergänzend eine Feldstudie 
mit Gruppen durchgeführt werden. 
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13.1 Hypothesen 


Das Geschlecht einer Lehrkraft (als automatische Kategorie; Fiske & Neuberg, 
1990; Krings & Kluge, 2020) kann eine Rolle spielen, um Kompetenzerwar- 
tungen bei Lernenden zu induzieren (s. Kapitel 10). Das Bild der Lehrkraft 
in der Schule hat sich von einem klassischen „männlichen Beruf“ zu einem 
„weiblichen“ entwickelt (vgl. Horstkemper, 2000) und weibliche Lehrpersonen 
sind zahlenmäßig in der deutlichen Mehrheit an deutschen allgemeinbildenden 
Schulen (73 % der Lehrkräfte sind weiblich; Statistisches Bundesamt, 2020d). 
Studien auf Basis des stereotype content model weisen darauf hin, dass 
(„durchschnittliche“ bzw. ,,typische“) Männer durchgehend wenig bis mittelhoch 
warm, jedoch kompetent bewertet werden (Bye et al., 2014; Durante et al., 
2014; Eckes, 2002; Fiske et al., 2002). Demgegenüber werden (,,durchschnitt- 
liche“ bzw. „typische“) Frauen warm beurteilt, aber teils inkompetent (Eckes, 
2002) oder kompetent (Bye et al., 2014; Durante et al., 2014; Fiske et al., 2002). 
Männern wird jedoch (deskriptiv in den erwähnten Studien) durchgehend eine 
höhere Kompetenz zugeschrieben als Frauen. Auch bei einer deutschen Stich- 
probe zeigte sich, dass Frauen warm sowie mittelhoch kompetent und Männer 
wenig warm und hoch kompetent beurteilt wurden (Asbrock, 2010). Unterschied- 
liche Fachdomänen sind mit bestimmten sozialen Gruppen verknüpft. So zeigte 
sich z. B., dass Assoziationen zwischen „männlich“ und Natur- und Technikwis- 
senschaften sowie zwischen „weiblich“ und Geistes- und Sozialwissenschaften 
bestehen (Guimond & Roussel, 2001; Miller et al., 2018; Nosek et al. 2009; 
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Plante et al., 2009; Smyth & Nosek, 2015; Su et al., 2009). Frauen wer- 
den mehr kommunale (z. B. kommunikativ, kooperativ, emotional) und weniger 
agentische Eigenschaften (z. B. autonom, dominant, selbstbewusst) zugeschrie- 
ben als Männern (u. a. Bosak et al., 2008; Diehl et al., 2004), was sich auch 
in den beschriebenen Ergebnissen zum stereotype content model zeigt und die 
Geschlechts-Professions-Assoziationen bedingen können. 

Lehrkräfte in der Schule werden teilweise als wenig kompetent wahrgenom- 
men (Imhoff et al., 2013; für Lehramtsstudierende s. Ihme & Möller, 2015), 
teilweise als kompetent (Eckes, 2002). Es stellt sich also die Frage, wie die 
unterschiedlichen Ergebnisse zustande kommen. Denkbar wäre, dass es unter- 
schiedliche Gruppen von Lehrkräften gibt, die zu Substereotypisierungen (vgl. 
Machunsky, 2020) führen – z. B. auf Basis automatischer Kategorien (Fiske & 
Neuberg, 1990; Krings & Kluge, 2020). Innerhalb einer älteren Untersuchung von 
Mancus (1992) bewerteten Kinder weibliche Lehrkräfte kompetenter als männli- 
che. Bei Imhoff et al. (2013) zeigten sich jedoch keine wesentlichen Unterschiede 
zwischen weiblichen und männlichen Lehrkräften bezüglich der Kompetenzein- 
schätzung. Durch die uneindeutige Befundlage ergibt sich folgende ungerichtete 
Hypothese, um zu überprüfen, ob Frauen oder Männer im Lehrberuf kompetenter 
wahrgenommen werden: 


Hypothese Г Weibliche und männliche Lehrkräfte werden (bei unbekanntem 
Unterrichtsfach) unterschiedlich kompetent beurteilt. 


Außerdem soll parallel zum Geschlecht das Unterrichtsfach betrachtet und somit 
überprüft werden, ob es Geschlechts-Professions-Assoziationen (u. a. Guimond & 
Roussel, 2001; Miller et al., 2018; Nosek et al. 2009; Plante et al., 2009; Smyth & 
Nosek, 2015; Su et al., 2009) auch bei Lehrkräften gibt. Frauen als Lehrkräfte 
sollten demnach in mathematischen und naturwissenschaftlichen Fächern weni- 
ger kompetent beurteilt werden und Männer weniger kompetent in geistes- und 
sozialwissenschaftlichen Unterrichtsfächern. 

Für kognitive Schemata, die sich auf schulische Lehrkräfte beziehen, zeigte 
sich bei Zander et al. (2015), dass Männer im Vergleich zu Frauen eher als 
qualifiziert genug beurteilt wurden, um Physik zu unterrichten. Weibliche Lehr- 
kräfte, die Physik unterrichten, wurden auch optisch männlicher konstruiert als 
weibliche Lehrkräfte, die Deutsch unterrichten (ermittelt mit dem reverse cor- 
relation classification task, Degner et al., 2019). Für Physik scheint es also 
eine Geschlechts-Professions-Assoziation zu geben. Im Folgenden sollen als 
Unterrichtsfächer Mathematik und Deutsch fokussiert und verglichen werden, 
da beide Fächer den gleichen Stellenwert im deutschen Schulsystem einnehmen 
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(im quantitativen Sinn: Fach ab der ersten Klasse unterrichtet und gleiche bzw. 
ähnliche Anzahl Unterrichtsstunden). 


Hypothese 2: Weibliche Lehrkräfte werden im Unterrichtsfach Deutsch kompe- 
tenter eingeschätzt als männliche Lehrkräfte. 

Hypothese 3: Männliche Lehrkräfte werden im Unterrichtsfach Mathematik 
kompetenter eingeschätzt als weibliche Lehrkräfte. 


Im stereotype content model geht in der sozialen Wahrnehmung die Wärmebe- 
urteilung der Kompetenzbeurteilung voraus (s. Kapitel 5). Außerdem wurden 
bildbasierte Fallvignetten präsentiert (s. u.), sodass das „beauty is good“ ste- 
reotype (Dion et al., 1972; Eagly et al., 1991; Langlois et al., 2000) die 
Bewertung der Kompetenz beeinflussen kann. Deshalb werden alle Hypothesen 
zusätzlich unter Kontrolle der Wärme- und Attraktivitätsbeurteilung getestet. Die 
Überprüfung mit Kontrollvariablen erfolgt explorativ (ungerichtet), um etwaige 
gegenteilige Muster und weitere Haupt- und Interaktionseffekte detektieren zu 
können. 


13.2 Methodik 
13.2.1 Stichprobe 


An der Umfrage nahmen insgesamt 153 Proband*innen teil, von denen acht 
ausgeschlossen wurden, weil sie weniger als 50 % der Items (der nicht- 
soziodemografischen Variablen) beantworteten. Somit ergab sich eine Stichprobe 
von 145 Personen. Davon waren 99 weiblich und 40 männlich, sechs Personen 
machten keine Angabe zu ihrem Geschlecht. Das Durchschnittsalter betrug 28.0 
Jahre (SD = 7.38; Spannweite: 18-52); 27 Proband*innen gaben ihr Alter nicht 
an. Der Großteil der Teilnehmenden studierte (n = 91, davon 51 Psychologie und 
2 ein Lehramt), 47 Personen waren keine Studierenden (und zumeist in einem 
psychosozialen Beruf tätig; n = 19 eindeutig identifizierbar), sieben Personen 
machten keine Angabe. 


13.2.2 Vorgehen 


Es wurde eine Online-Umfrage (unipark, Questback GmbH) erstellt, die im Zeit- 
raum vom 17.02.2015 bis zum 01.04.2015 geöffnet war. Die Proband*innen 
wurden über E-Mail-Verteiler für Psychologie-Studierende (in Braunschweig und 
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Osnabriick) sowie tiber soziale Medien akquiriert. Die Studie wurde als ,,Stu- 
die zur Einschätzung von Personen“ beschrieben. Nachdem die Teilnehmenden 
über die Freiwilligkeit, Anonymität und den Datenschutz aufgeklärt worden 
waren, wurde zufällig eine von sechs Fallvignetten präsentiert, zu denen die 
Proband*innen ihre persönliche Einschätzung geben sollten. Die Fallvignetten 
bestanden aus einem Porträt, das entweder ein weibliches oder männliches Durch- 
schnittsgesicht nach Gründl (2011!, S. 49 weibliches Porträt, S. 21 männliches 
Porträt) in Graustufen und mit 25 % Rauschfilter zeigte (s. Abbildung 13.1). 
Bildreize wurden u. a. auch bei Martin und Smith (1990) sowie Joye und Wil- 
son (2015) genutzt. Zusätzlich wurde mit einem Satz das dargestellte Porträt 
als Lehrkraft beschrieben: „Dies ist eine Lehrkraft, die an einer Supervisions- 
maßnahme teilnimmt.“ Neben „Lehrkraft“ wurden die Porträts außerdem als 
„Deutsch-Lehrkraft“ oder „Mathematik-Lehrkraft“ bezeichnet. Es handelte sich 
also um ein 2 x 3-Design. Anschließend wurden soziodemografische Daten erho- 
ben und am Ende über das konkrete Anliegen der Befragung aufgeklärt sowie sich 
bei den Proband*innen für die Teilnahme bedankt. Die Daten wurden mittels IBM 
SPSS Statistics 25 und MPlus 8 ausgewertet. 


Abbildung 13.1 Weibliches und männliches Durchschnittsgesicht (modifiziert nach 
Gründl, 2011; Studie 1) 


! Mit freundlicher Genehmigung von Martin Gründl. 
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13.2.3 Instrumente und Variablen 


Als abhängige Variable wurde die Beurteilung der Kompetenz erfragt und die 
Beurteilung der Wärme sowie der Attraktivität wurden als Kontrollvariablen 
herangezogen (Fragebogen s. Zusatzmaterial). 

Kompetenzbeurteilung: Die Einschätzung der Kompetenz wurde mittels einer 
Adjektivliste erfasst, bei der die Teilnehmenden auf einer vierstufigen Likert- 
Skala (1 = „stimme gar nicht zu“ bis 4 = „stimme vollkommen zu“) angeben 
sollten, inwieweit das Adjektiv auf die dargestellte Person der Fallvignette 
zutrifft. Hierfür wurden folgende Adjektive herangezogen (angelehnt an Fiske 
et al., 1999; Imhof et al., 2013; Rosenberg et al., 1968): kompetent, fähig, 
effizient, intelligent, konkurrenzfähig, selbstbewusst und eigenständig. Die Rei- 
henfolge der Items wurde zufällig präsentiert. Nach Faktorenanalysen und aus 
inhaltlichen Gründen (s. u.) wurden die Items konkurrenzfähig, selbstbewusst 
und eigenständig nicht berücksichtigt. Die Reliabilität (Cronbachs Alpha) der 
4-Item-Lösung liegt mit а = .831 in einem zufriedenstellenden Bereich. 

Wärmebeurteilung: Die Einschätzung der Wärme wurde analog mit einer 
Adjektivliste und einer vierstufigen Likert-Skala wie die Beurteilung der Kom- 
petenz erfasst. Die Items (angelehnt an Fiske et al., 1999; Imhof et al., 2013; 
Rosenberg et al., 1968) wurden zusammen in zufälliger Reihenfolge mit denen 
der Kompetenzbeurteilung präsentiert: warmherzig, gutmütig, wohlwollend, sym- 
pathisch, offen, tolerant und vertrauenswürdig. Die Items offen, tolerant und 
vertrauenswürdig wurden auf Basis von inhaltlichen und faktoranalytischen 
Betrachtungen (s. u.) final nicht berücksichtigt. Die interne Konsistenz (Cron- 
bachs Alpha) der 4-Item-Lösung liegt in einem zufriedenstellenden Bereich mit 
a = .856. Die Wärmebeurteilung wird im Sinne des stereotype content model als 
Kontrollvariable herangezogen. 

Attraktivitätsbeurteilung: Die Bewertung der Attraktivität wurde mit folgen- 
dem Item auf einer siebenstufigen Likert-Skala (1 = „sehr unattraktiv“ bis 
7 = „sehr attraktiv“) erhoben: „Wie optisch attraktiv finden Sie die Lehrkraft?“ 
Die Erfassung der Attraktivitätseinschätzung mit einem Item ist nicht unüblich 
(z. B. bei Kemper et al., 2014). Die Attraktivitätsbeurteilung wird berücksichtigt, 
um das „beauty is good“ stereotype aufgrund des Bildreizes zu kontrollieren. 

Eine konfirmatorische Faktorenanalyse mit robuster Maximum-Likelihood- 
Schätzung (MLR) zeigte für eine 2-Faktoren-Lösung (Kompetenz- und 
Wärmebeurteilung) mit jeweils sieben Items der Kompetenz- und Wärmebe- 
urteilung ungenügende Fitmaße (пар = 2.545; CFI = .857; TLI = .829; 
RMSEA = .103; SRMR = .092; Hu & Bentler, 1999: Weiber & Miihlhaus, 
2014). Ein einfaktorielles Modell ergab eine schlechtere Lösung (x7/df = 4.996; 
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CFI = .626; TLI = .558; RMSEA = .166; SRMR = .134). Aus inhaltlichen Griin- 
den wurden anschließend die Items ,,vertrauenswiirdig“, „konkurrenzfähig“ und 
„eigenständig“ aus den Analysen herausgenommen. Die Vertrauenswiirdigkeit kann 
u. U. bei Lehrpersonen auch auf fachliche Kompetenz hinweisen. Konkurrenz- 
fähigkeit und Eigenständigkeit könnten ungeeignet sein, um die Kompetenz von 
Lehrpersonen zu erfassen. Danach wurden zusätzlich schrittweise Items auf Basis der 
Trennschärfe entfernt, sodass jeweils vier Items pro Faktor verblieben? (Itemschwie- 
rigkeiten und Trennschärfen s. Zusatzmaterial). Die endgültige, ökonomische zwei- 
faktorielle Lösung ergab zufriedenstellende Fitmaße стар = 1.423; CFI = .980; 
TLI = .971; RMSEA = .054; SRMR = .049). Ein alternativ getestetes einfaktori- 
elles Modell mit allen acht verbliebenen Items war zu verwerfen (x?/df = 8.889; 
CFI = .623; TLI = .472; RMSEA = .233; SRMR = .122). Die 2-Faktoren-Lösung 
mit jeweils vier Items konnte auch an anderer Stelle zur Beurteilung von Erzie- 
hungsberatenden zufriedenstellende FitmaBe erzielen (Hackbart et al., 2020). 
Aufgrund der geringen Abstufungen der Likert-Skala (Bühner, 2010) wurde die 
finale Faktorenstruktur zusätzlich mit einem auch fiir ordinale Daten angemes- 
senen Weighted-Least-Squares-Verfahren (WLSMV; Eid et al., 2017; Holtmann 
et al., 2016; Li, 2016) mit Ausnahme des RMSEA bestätigt (пар = 2.547; 
CFI = .976; TLI = .964; RMSEA = .103; МЕМЕЗ = 0.712). Der RMSEA 
fällt jedoch bei kleinen Stichproben (N < 250) häufig hoch aus (vgl. 
Weiber & Mühlhaus, 2014). 


13.3 Ergebnisse 


Die Kennwerte der Variablen sowie die Korrelationen untereinander sind in 
Tabelle 13.1 aufgelistet, die Kennwerte nach Gruppen in Tabelle 13.2. Da einige 
der Variablen hinsichtlich der Normalverteilung auffällig sind (auf Basis von 
Shapiro-Wilk-Tests), wurden sowohl parametrische als auch nicht-parametrische 
Korrelationen berechnet. Die Quantil-Quantil-Diagramme sind bei optischer 
Inspektion jedoch unauffällig. 


2 Die Reduzierung der Items wurde teilweise trotz guter Trennschärfen vorgenommen, um 
für die folgenden Studien eine ökonomische Adjektivliste zu erhalten. 


3 Weighted Root Mean Square Residual 
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Die bivariaten Analysen zur Uberpriifung der Hypothesen wurden mit t-Tests 
durchgeführt. Weibliche Lehrkräfte ohne bekanntes Unterrichtsfach (M = 3.106, 
SD = 0.575) wurden signifikant kompetenter beurteilt als männliche Lehrkräfte 
in einem unbekannten Unterrichtsfach (М = 2.639, SD = 0.544; 1(42) = 2.706, 
р = .010; d = 0.830; 1-В = .753)*. Auch über alle Bedingungen der Unter- 
richtsfächer hinweg (Deutsch, Mathematik und unbekanntes Unterrichtsfach) 
waren die Kompetenzbeurteilungen für weibliche Lehrkräfte höher (M = 2.964, 
SD = 0.586) als für männliche (М = 2.652, SD = 0.539; t(141) = 3.302, 
p = .001; а = 0.554; 1-6 = .906). Für den Fachunterricht ergab sich, 
dass weibliche Deutschlehrkräfte signifikant kompetenter beurteilt wurden 
(M = 2.891, SD = 0.532) als männliche (M = 2.520, SD = 0.478; t(46) = 2.546, 
pı = .007; а = 0.736; 1-ß = .806). Kein Geschlechtsunterschied ergab sich für 
den Mathematikunterricht (t(49) = 0.516, p; = .304; d = 0.145; 1-6 = .128). 

Für die multivariate Berechnung der Gruppenunterschiede unter Berücksich- 
tigung des stereotype content model und des „beauty is good“ stereotype wurde 
eine Kovarianzanalyse durchgeführt, bei der die Kompetenzbeurteilung als abhän- 
gige Variable einging und das Geschlecht sowie das Unterrichtsfach der Lehrkraft 
als unabhängige Variable. Die Attraktivitäts- und Wärmebeurteilung gingen als 
Kontrollvariablen ein. Die Kovarianzanalyse ist ein robustes Verfahren, auch 
gegenüber Voraussetzungsverletzungen (Harwell, 2003; vgl. Bortz & Schuster, 
2010). Nichtsdestotrotz soll kurz auf die Eignung des vorliegenden Datensatzes 
eingegangen werden. Die Prämissen für die hypothesenprüfende Kovarianz- 
analyse wurden in Anlehnung an Huber et al. (2014) überprüft: (1.) Keine 
Ausreißer: Auf einen Ausschluss von Ausreißern wurde verzichtet, da ausschließ- 
lich geschlossene Skalen vorlagen. (2.) Eine randomisierte Gruppenzuordnung 
lag vor. (3.) Gruppengröße über 20: Eine Gruppe (männliche Lehrkraft ohne 
genanntes Fach) liegt mit 18 Proband*innen leicht unter den empfohlenen 
20 Teilnehmenden pro Gruppe. (4.) Die Varianzhomogenität war gemäß dem 
Levene-Test gegeben (F(5, 133) = 0.545, p = .742). (5.) Die Normalvertei- 
lung der Variablen ist teils gegeben, teils nicht (abweichend von Huber et al., 
2014, mit dem Shapiro-Wilk-Test berechnet; s. Tabelle 13.2). (6.) Die Kovariaten 
bzw. die Kontrollvariablen korrelieren mit der abhängigen Variablen. (7.) Es gab 
keine signifikanten Interaktionseffekte einer unabhängigen Variablen mit einer 


4 Das Signifikanzniveau für gerichtete Hypothesen bzw. einseitige Tests wird mit p; ange- 
geben, für ungerichtete Hypothesen bzw. für zweiseitige Tests mit p. Ein Signifikanzniveau, 
das sich aus der Überprüfung mit Bootstrap-Verfahren ergibt, wird mit рь (zweiseitig) ange- 
geben. Alle angegebenen Powerwerte (1-ß) wurden für die erzielten Effektstärken über 
Post-hoc-Analysen (а = .05) mit der Software G*Power 3.1 bestimmt. 
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Kontrollvariablen auf die Kompetenzbeurteilung. (8.) Homogenitat der Kontroll- 
variablen über die Experimentalgruppen: Da die Relation von kleinster zu größter 
Experimentalgruppe mit 1.56 (18 zu 28) nur leicht über dem empfohlenen Grö- 
Benunterschied von 1.5 liegt, wurde auf die Überprüfung des Einflusses der 
Kontrollvariablen auf die Experimentalgruppen verzichtet, da von einer relativen 
Gleichbesetzung der Zellen ausgegangen werden kann. Aufgrund der geringen 
Abweichungen und unter Anbetracht der Robustheit von varianzanalytischen 
Verfahren wurde die geplante Kovarianzanalyse durchgeführt. 

Zusätzlich zur Überprüfung der Voraussetzungen der Kovarianzanalyse wurde 
eine potenzielle Eigengruppenbevorzugung (vgl. Balliet et al., 2014; DiDonato 
et al., 2011; Robbins & Krueger, 2005) auf Basis des Geschlechts in einer separa- 
ten Varianzanalyse betrachtet. Es sollte betrachtet werden, ob Männer männliche 
Lehrkräfte besser bewerteten und Frauen weibliche Lehrkräfte. Die Varianzana- 
lyse mit dem Geschlecht der beschriebenen Lehrkräfte und der Proband*innen 
als unabhängige Variablen ergab einen signifikanten Effekt des Geschlechts der 
Lehrkraft Mp’ = .067, p = .002)° , aber weder einen signifikanten Haupteffekt 
des Geschlechts der Proband*innen Mp? = .000, p = .917) noch eine signifi- 
kante Interaktion (прг = .005, p = 428; s. Zusatzmaterial). Somit kann eine 
Eigengruppenbevorzugung auf Basis des Geschlechts ausgeschlossen werden. 

In Tabelle 13.3 sind die Ergebnisse der hypothesenpriifenden Varianzanalyse 
mit Kontrollvariablen dargestellt. Es zeigte sich in der Kovarianzanalyse, dass 
die Wärmebeurteilung ein signifikanter Prädiktor für die Kompetenzbeurteilung 
ist (F(1, 131) = 24.722, p < .001; ip” = .159), die Attraktivitätsbeurteilung hin- 
gegen nicht (F(1, 131) = 1.260, p = .264; np” = .010). Weitergehend ergaben 
sich Unterschiede hinsichtlich des Geschlechts der Lehrkraft (F(1, 131) = 7.896, 
p = .006). Die Effektstärke Gis” = .057) weist auf einen kleinen Effekt hin. 
Bei Inspektion der Konfidenzintervalle zeigte sich (unter Kontrolle der 
Warme- und Attraktivitätsbeurteilung; s. Tabelle 13.4), dass weibliche Lehr- 
kräfte (М = 2.94; 95%-СІ = 2.82-3.06) kompetenter eingeschätzt wurden als 
männliche (М = 2.69; 95%-СІ = 2.56-2.80). 


5 Das Effektstärkemaß partielles Eta-Quadrat wird mit Np? angegeben. 
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Tabelle 13.3 Ergebnisse der Kovarianzanalyse zur Aufklärung der Kompetenzbeurteilung 
(Studie 1) 


Quelle der Varianz df F p Partielles n? 
Korrigiertes Modell 7 7.456 < .001 .285 
Konstanter Term 1 54.767 < .001 295 
Kontrollvariablen 

Warmebeurteilung 1 24.722 < .001 159 
Attraktivitätsbeurteilung 1 1.260 .264 .010 
Bedingungen 

Geschlecht der LK 1 7.896 .006 .057 
Unterrichtsfach der LK 2 1.536 .219 .023 
Interaktion 

Geschlecht der LK x 2 1.774 174 .026 
Unterrichtsfach der LK 

Fehler 131 


Anmerkungen. Korrigiertes R? = 247 (R? = .285). N = 139. LK = Lehrkraft. 


Das Unterrichtsfach der Lehrkraft hatte keinen signifikanten Einfluss auf die 
Kompetenzbeurteilung (#(2, 131) = 1.536, p = .219; а = .023). Außerdem 
gab es keine signifikante Interaktion von Geschlecht und Unterrichtsfach der 
Lehrkraft (F(2, 131) = 1.774, p = .174; np? = .026). Beim deskriptiven Ver- 
gleich der sechs Gruppen anhand der Konfidenzintervalle (bei Kontrolle für 
Wärme- und Attraktivitätsbeurteilung; s. Tabelle 13.4), zeigte sich, dass weibliche 
Lehrkräfte mit unbekanntem Unterrichtsfach (M = 3.04; 95%-CI = 2.83-3.25) 
kompetenter eingeschätzt wurden als männliche Deutschlehrkräfte (M = 2.57; 
95%-CI = 2.36-2.77). 
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Tabelle 13.4 Geschätzte Randmittel unter Berücksichtigung von Kontrollvariablen (Studie 


1) 


95%-СІ 
Gruppenzuordnung N M SE LL UL 
Geschlecht der LK 
Mannlich 65 2.690 0.064 2.563 2.818 
Weiblich 74 2.942 0.060 2.823 3.061 
Unterrichtsfach der LK 
Deutsch 47 2.719 0.074 2.572 2.865 
Mathematik 50 2.900 0.073 2.755 3.045 
Ohne Fach 42 2.829 0.080 2.671 2.987 
Geschlecht der LK Unterrichtsfach der LK 
Männlich Deutsch 25 2.565 0.102 2.363 2.767 
Mathematik 22 2.885 0.110 2.667 3.102 
Ohne Fach 18 2.621 0.120 2.385 2.858 
Weiblich Deutsch 22 2.873 0.109 2.657 3.089 
Mathematik 28 2.915 0.096 2.726 3.105 
Ohne Fach 24 3.037 0.106 2.828 3.246 


Anmerkungen. Abhängige Variable: Kompetenzbeurteilung. Die Kontrollvariablen im 
Modell wurden anhand der folgenden Werte berechnet: Wärmebeurteilung = 2.617, 
Attraktivitätsbeurteilung = 4.763. Anpassung für Mehrfachvergleiche nach Bonferroni. 
LK = Lehrkraft. 


13.4 Zusammenfassung, Interpretationen und 
Limitationen 


In der durchgeführten Online-Untersuchung sollte herausgefunden werden, ob 
es Substereotype gegenüber bestimmten Gruppen von Lehrkräften gibt bzw. ob 
sich Geschlechts-Professions-Assoziationen auch bei Lehrkräften wiederfinden. 
Diese Stereotype und Assoziationen sollten gemäß dem transaktionalen Modell 
von Nickel (1985) durch den soziokulturellen Kontext geprägt sein sowie mit 
Kompetenzerwartungen einhergehen. 
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Es zeigte sich auf Basis einer durchgeführten Studie mit Fallvignetten, dass 
weibliche Lehrkräfte kompetenter beurteilt werden als männliche. Dies wider- 
spricht dem Befund von Imhoff et al. (2013), die keine Unterschiede bei der 
Beurteilung von männlichen und weiblichen Lehrkräften fanden, und unterstützt 
die Ergebnisse von Mancus (1992). Eine methodische Erklärung zur positiveren 
Kompetenzbewertung der weiblichen Lehrkräfte im Vergleich zu den männli- 
chen kann im Stimulus-Material und dem „beauty is good“ stereotype (Dion 
et al., 1972; Eagly et al., 1991; Langlois et al., 2000) liegen. So gingen für 
das Bild der weiblichen Lehrkraft 64 Bilder zum Erstellen des Porträts und für 
die männliche Lehrkraft 32 Bilder ein, was zu einer höheren Durchschnittlich- 
keit und somit zu einer höheren Attraktivitätsbeurteilung führen kann bzw. es 
gingen mehr attraktive Bilder in das weibliche Gesicht ein als in das männli- 
che, was die Attraktivitätszuschreibung auch erhöhen kann (vgl. Gründl, 2011). 
Zudem wurden bei Joye und Wilson (2015) Bilder von Frauen attraktiver bewer- 
tet als Bilder von Männern. Es zeigte sich ein kleiner korrelativer Zusammenhang 
zwischen Geschlecht der Lehrkraft und Attraktivitätsbeurteilung zugunsten der 
weiblichen Lehrkräfte sowie darüber hinaus ein weiterer kleiner Zusammenhang 
zwischen der Kompetenzbeurteilung und der Attraktivitätsbeurteilung, was auf 
einen mediierenden Effekt hinweisen kann. 

Bei einer gemeinsamen Berücksichtigung von Geschlecht der Lehrkraft, 
Unterrichtsfach, Attraktivitäts- und Wärmebeurteilung verliert sich der signifi- 
kante Effekt der Attraktivitätsbeurteilung. Lediglich das Geschlecht der Lehrkraft 
und die Wärmebeurteilung können die Kompetenzbeurteilung signifikant vor- 
hersagen. Besondere Bedeutsamkeit für die Kompetenzbeurteilung mit einem 
mittelgroßen Effekt hat die Wärmebeurteilung (Np? = .159). Dies kann damit 
interpretiert werden, dass das stereotype Bild von guten, kompetenten Lehrkräf- 
ten ein sympathisches und fürsorgliches Verhalten einschließt. Generell werden 
Lehrkräfte als besonders warm beschrieben (Eckes, 2002; Imhoff et al., 2013; für 
Lehramtsstudierende s. Ihme & Möller, 2015). 

Es ist zu vermuten, dass (gerade bei unbekanntem Fach) der Erziehungsauftrag 
der Lehrkräfte stärker im Fokus steht als der Auftrag, Wissen zu vermitteln, und 
somit die Kompetenz von Lehrkräften über die Erziehungsfähigkeiten beurteilt 
wird. Die stärkere Zuweisung kommunaler Eigenschaften für Frauen im Ver- 
hältnis zu Männern (u. a. Bosak et al., 2008; Diehl et al., 2004) kann somit 
die höhere Kompetenzbeurteilung erklären. Allgemein ergreifen Frauen mehr 
Berufe im erzieherischen und pflegenden Bereich als Männer (Autorengruppe 
Fachkräftebarometer, 2019; Bundesagentur für Arbeit, 2021) und studieren u. a. 
häufiger Erziehungswissenschaften (79 %) oder mit dem Ziel eines Lehramts 
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(71 %; Statistisches Bundesamt, 2020c). Für die geschlechtsabhängige Kom- 
petenzbeurteilung von Lehrkräften muss jedoch festgehalten werden, dass in 
der vorliegenden Untersuchung lediglich ein kleiner Effekt Mp? = .057) erzielt 
wurde. 

Die fehlende Signifikanz hinsichtlich der Interaktion von Unterrichtsfach und 
Geschlecht der Lehrkraft in den multivariaten Analysen widerspricht den Hypo- 
thesen 2 und 3. Allerdings zeigte sich in den bivariaten Analysen, das weibliche 
Deutschlehrkräfte kompetenter beurteilt werden als männliche Deutschlehrkräfte. 
Bisherige Untersuchungen, die den Deutsch- und Physikunterricht fokussierten, 
konnten auch Geschlechts-Professions-Assoziationen ausmachen (Degner et al., 
2019; Zander et al., 2015). Es kann vermutet werden, dass die Fachauswahl 
bedeutsam ist. So kann der Mathematikunterricht in der Schule weniger männ- 
lich assoziiert sein als der Physikunterricht. Bei Plante et al. (2009) zeigte 
sich, dass Schiiler*innen Mathematik nicht als männliche Domäne assoziie- 
ren, aber den Sprachunterricht als weibliche. Eine systematische Analyse der 
Geschlechts-Professions-Assoziationen für die Gruppe der Lehrkräfte (und andere 
Lehrpersonen) wäre künftig wünschenswert. 

Auf Basis des Untersuchungsdesigns ergeben sich einige Limitationen. Bei der 
Erhebung wurde auf eine Gelegenheitsstichprobe zurückgegriffen, die hinsichtlich 
der Interpretierbarkeit der Ergebnisse für eine Zielpopulation begrenzt ist (vgl. 
Döring & Bortz, 2016). Dies macht sich in der hohen Anzahl von Studierenden 
und von Proband*innen aus dem psychosozialen Bereich bemerkbar, die nicht 
ohne Weiteres als repräsentativ für die Allgemeinbevölkerung angesehen werden 
können. Außerdem muss erwähnt werden, dass die Stichprobe aus erwachsenen 
Proband*innen bestand (Mindestalter = 18). Es kann jedoch davon ausgegan- 
gen werden, dass die Teilnehmenden auf Basis ihrer aufgebauten Schemata und 
Stereotype, die sich im Laufe der Zeit herausgebildet haben (soziale Lernvergan- 
genheit; Nickel, 1985), die beschriebenen Lehrkräfte beurteilt haben. Inwieweit 
diese Ergebnisse auch für aktuell schulpflichtige Kinder und Jugendliche erzielt 
werden können, bleibt auf Basis der vorliegenden Daten offen und müsste künf- 
tig in der Forschung adressiert werden. Schließend muss noch erwähnt werden, 
dass theoriebasierte Items eigenständig konstruiert wurden. Diese und die daraus 
entstandenen Skalen sind deswegen nicht validiert, die Reliabilitäten und die fak- 
torielle Validität können jedoch als angemessen angesehen werden. Problematisch 
an den Items kann auch sein, dass sie ausschließlich positiv gepolt waren (vgl. u. 
a. Bühner, 2010; Döring & Bortz, 2016). 

Zusammenfassend kann festgehalten werden, dass weibliche Lehrkräfte kom- 
petenter beurteilt werden als männliche. Dies spricht für die Entwicklung von 
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(relationalen) Schemata bzw. Substereotypen. Um den Einfluss der Attraktivi- 
tät methodisch zu eliminieren und der Hypothese nachzugehen, dass weibliche 
Lehrkräfte insbesondere bei erzieherisch assoziierten Aufgaben kompetenter 
eingeschätzt werden als männliche Lehrkräfte, wurde eine zweite Studie mit text- 
basierten Fallvignetten erstellt. Mit der zweiten Studie sollten außerdem die in der 
ersten Studie erzielten Ergebnisse, insbesondere zu den Geschlechts-Professions- 
Assoziationen, erneut überprüft werden. 


Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 Inter- 
national Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche 
die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem 
Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle 
ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, 
ob Änderungen vorgenommen wurden. 

Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen eben- 
falls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts 
anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Com- 
mons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt 
ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des 
jeweiligen Rechteinhabers einzuholen. 
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141 Hypothesen 


Die zweite Studie sollte weitestgehend die Hypothesen zu Geschlechts- 
Professions-Assoziationen der ersten Studie (s. Kapitel 13) mit einem bildrei- 
zunabhängigen Design erneut überprüfen. 


Hypothese 1: Weibliche Lehrkräfte werden im Unterrichtsfach Deutsch kompe- 
tenter eingeschätzt als männliche Lehrkräfte. 

Hypothese 2: Männliche Lehrkräfte werden im Unterrichtsfach Mathematik 
kompetenter eingeschätzt als weibliche Lehrkräfte. 


Zusätzlich wurde die Schulform der Lehrkräfte berücksichtigt. Der Lehrberuf 
an allgemeinbildenden Schulen ist beruflich eine „weibliche“ Domäne (vgl. 
Horstkemper, 2000; s. Kapitel 13). Der Anteil der Frauen im Lehrberuf variiert 
allerdings je nach Schul- und Unterrichtsform und spiegelt das Bild wider, dass 
die größten Frauenanteile eher in Berufen der Pflege und Erziehung zu finden sind 
(Autorengruppe Fachkräftebarometer, 2019; Bundesagentur für Arbeit, 2021), 
wo kommunale Eigenschaften (z. B. kommunikativ, kooperativ, emotional), die 
eher Frauen zugeschrieben werden (u. a. Bosak et al., 2008; Diehl et al., 2004; 
Eagly & Mladinic, 1994), besonders relevant sind. So sind zwar 73 % der Lehr- 
kräfte weiblich, allerdings 89 % in Grundschulen, 81 % in schulartunabhängigen 
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Orientierungsstufen, 78 % in Förderschulen, 76 % in Schulen des Gesundheits- 
wesens, 66 % in Realschulen, 65 % in Hauptschulen, 61 % in Gymnasien und 
53 % in beruflichen Schulen (Statistisches Bundesamt, 2020d). In Hochschulen 
liegt der Anteil der Frauen bei 40 % (hauptberufliches wissenschaftliches und 
künstlerisches Personal; Statistisches Bundesamt, 2020b). 

Für den Lehr-Lern-Kontext sollten also nun stereotypkonform in Bereichen, in 
denen erzieherische Aspekte stärker im Fokus stehen (z. B. in der Grundschule), 
Frauen als geeigneter angesehen werden als Männer. Männer hingegen sollten 
als geeigneter oder mindestens als genauso geeignet beurteilt werden wie Frauen, 
wenn der Fokus weniger auf erzieherischen und stärker auf fachlichen Aspekten 
liegt (z. B. im Gymnasium). Dies sollte sich auch in der Kompetenzbeurteilung 
niederschlagen: 


Hypothese 3: Männliche Lehrkräfte werden im Gymnasium kompetenter ein- 
geschätzt als in der Grundschule. 

Hypothese 4: Weibliche Lehrkräfte werden in der Grundschule kompetenter 
eingeschätzt als im Gymnasium. 

Hypothese 5: Weibliche Lehrkräfte werden in der Grundschule kompetenter 
eingeschätzt als männliche Lehrkräfte in der Grundschule. 


Wie in der ersten Studie soll auf Basis des stereotype content model (s. Kapitel 5) 
für die Wärmebeurteilung, die der Kompetenzbeurteilung vorausgeht, kontrol- 
liert und die Hypothesen sowie weitere Haupt- und Interaktionseffekte explorativ 
gemeinsam betrachtet werden. 


14.2 Methodik 
14.2.1 Stichprobe 


An der Umfrage nahmen insgesamt 284 Proband*innen teil, von denen 19 
ausgeschlossen wurden, weil sie weniger als 50 % der Items (der nicht- 
soziodemografischen Variablen) beantworteten, und weitere elf Proband*innen, 
weil sie an der ersten Studie teilnahmen. Somit ergab sich eine Stichprobe 
von 254 Personen. Davon waren 206 weiblich und 46 männlich, zwei Perso- 
nen machten keine Angabe zu ihrem Geschlecht. Das Durchschnittsalter war mit 
24.9 Jahren (SD = 5.88; Spannweite: 18-60) unter dem der ersten Studie. Das 
Alter wurde von einer teilnehmenden Person nicht angegeben. Der Großteil der 
Proband*innen studierte (n = 224, davon 58 Psychologie und 78 ein Lehramt), 
24 Personen waren keine Studierenden (psychosozialer Beruf: n = 6 eindeutig 
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identifizierbar; wissenschaftlicher Beruf: n = 6 eindeutig identifizierbar), sechs 
Personen machten hierzu keine Angabe. 


14.2.2 Vorgehen 


Es wurde eine Online-Umfrage (unipark, Questback GmbH) erstellt, die vom 
15.12.2015 bis zum 11.08.2016 geöffnet war. Die Proband*innen wurden über 
E-Mail-Verteiler für Psychologie-Studierende (in Braunschweig und Osnabrück) 
sowie über soziale Medien akquiriert. Bei der Akquise wurde wie in der ersten 
Studie die Beschreibung „Studie zur Einschätzung von Personen“ genutzt. 
Nachdem die Teilnehmenden über die Freiwilligkeit, Anonymität und den 
Datenschutz aufgeklärt wurden, wurde zufällig eine von acht textbasierten Fall- 
vignetten präsentiert, zu der die Proband*innen ihre persönliche Einschätzung 
geben sollten. Innerhalb der Fallvignetten, die auf denen von Zander et al. (2015) 
basierten, wurde eine Lehrkraft beschrieben, wobei das Geschlecht der Lehrkraft 
durch die Anrede (Herr, Frau), das Unterrichtsfach (Deutsch, Mathematik) und 
die Schulform (3. Klasse in der Grundschule, 8. Klasse im Gymnasium) zufällig 
variierten. Es handelte sich um ein 2 x 2 x 2-Design. Textbasierte Fallvignet- 
ten haben sich auch in bisher beschriebenen Studien zur sozialen Wahrnehmung 
und Kognition im Lehr-Lern-Kontext bewährt (u. a. Auwarter & Aruguete, 
2008; Glock, 2016; Glock & Krolak-Schwerdt, 2013, 2014; Meltzer & McNulty, 
2011; Müller et al., 2017; Zander et al., 2015). Im Folgenden ist die Vignette 
beispielhaft für die weibliche Deutschlehrkraft am Gymnasium präsentiert: 


Stellen Sie sich vor, Sie sind Schüler/in eines städtischen Gymnasiums. Mit dem Start 
in die achte Klasse bekommen Sie für den Deutschunterricht eine neue Fachlehrerin, 
Frau Beck. Frau Beck ist gerade auf die Schule gewechselt, nachdem sie ihr Refe- 
rendariat in einem anderen Gymnasium abschloss und ein paar Jahre dort gearbeitet 
hat. In der ersten Deutschstunde des Schuljahres sehen Sie sie zum ersten Mal. Vor 
dem Unterricht ist es wie immer sehr laut, dann klingelt die Glocke. Frau Beck stellt 
sich am Anfang der Unterrichtsstunde vor und beginnt anschließend mit dem ersten 
Thema des Schuljahres. 


Bitte stellen Sie sich Frau Beck bildlich vor, wie sie den Unterricht durchführt. Neh- 
men Sie sich dafür etwas Zeit. Beantworten Sie anschließend spontan die folgende 
Frage. Es gibt keine richtigen oder falschen Antworten. 


Anschließend wurden soziodemografische Daten erhoben und am Ende über das 
konkrete Anliegen der Befragung aufgeklärt sowie sich bei den Proband*innen 
für die Teilnahme bedankt. Die Daten wurden mittels IBM SPSS Statistics 25 
und MPlus 8 ausgewertet. 
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14.2.3 Instrumente und Variablen 


Als abhängige Variable wurde die Beurteilung der Kompetenz betrachtet und die 
Beurteilung der Wärme wurde als Kontrollvariable herangezogen (Fragebogen s. 
Zusatzmaterial). 

Kompetenzbeurteilung: Die Einschätzung der Kompetenz wurde mittels der 
sieben Adjektive der ersten Studie erfasst (kompetent, fähig, effizient, intelligent, 
konkurrenzfähig, selbstbewusst, eigenständig), wobei nur auf die 4-Item-Lösung 
(kompetent, effizient, fähig, intelligent) zurückgegriffen wurde. Abweichend zur 
ersten Studie mit einer vierstufigen Skala sollten die Proband*innen ihre Zustim- 
mung auf einer siebenstufigen Likert-Skala angeben (1 = „stimme gar nicht zu“ 
bis 7 = „stimme vollkommen zu“), um differenziertere Antworten zu ermögli- 
chen und somit die Varianz der Variablen zu erhöhen. Zusätzlich gab es eine 
„Keine Angabe“-Option. Die Reliabilität (Cronbachs Alpha) war mit a = .845 
zufriedenstellend. 

Wärmebeurteilung: Die Einschätzung der Wärme wurde mit den gleichen 
sieben Adjektiven der ersten Studie (warmherzig, gutmütig, wohlwollend, sym- 
pathisch, offen, tolerant, vertrauenswürdig) und mit der gleichen siebenstufigen 
Likert-Skala (und zusätzlich „Keine Angabe“) wie die Kompetenzbeurteilung 
erfasst. Die Items wurden zusammen mit denen der Kompetenzbeurteilung in 
einer gemeinsamen Adjektivliste zufällig variierend präsentiert. Es konnte für die 
ausgewählten vier Items der Wärmebeurteilung (warmherzig, gutmütig, wohlwol- 
lend, sympathisch) eine gute interne Konsistenz mit einem Cronbachs Alpha von 
a = .892 erzielt werden. Die Wärme wurde auch in dieser Studie im Sinne des 
stereotype content model als Kontrollvariable herangezogen. 

Die konfirmatorische Faktorenanalyse mit robuster Maximum-Likelihood- 
Schätzung (MLR) ergab im Vergleich zur ersten Studie schlechtere Fitmaße 
für zwei Faktoren mit je vier Items (ар = 2.982; CFI = .942; TLI = .915; 
RMSEA = .092; SRMR = .062; Ни & Bentler, 1999; Weiber & Ми ћаиз, 2014; 
Itemschwierigkeiten und Trennschärfen s. Zusatzmaterial). Eine einfaktorielle 
Lösung mit acht Items ergab keine Verbesserung der Fitmaße (x?/df = 10.290; 
CFI = .735; TLI = .629; RMSEA = .191; SRMR = .124). Auch unter Berück- 
sichtigung der ursprünglichen 14 Items in einem Faktor (x7/df = 6.274; 
CFI = 717; TLI = .662; RMSEA = .144; SRMR = .133) oder in zwei Fakto- 
ren (x2/df = 2.533; CFI = .917; TLI = .901; RMSEA = .078; SRMR = .083) 
konnten keine ausreichenden Fitmaße erzielt werden. Aufgrund der relativ kleinen 
Stichprobengröße, die der Faktorenanalyse zugrunde lag (N < 250; aufgrund von 
missing data), wurde ein stärkeres Gewicht auf den CFI und den SRMR gelegt 
(gemäß den Empfehlungen von Hu & Bentler, 1999; vgl. Weiber & Mühlhaus, 
2014) und die 2-Faktoren-Lösung mit jeweils vier Items angenommen. 
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14.3 Ergebnisse 


Die Kennwerte der Variablen sowie die Korrelationen sind in Tabelle 14.1 aufge- 
listet, die Kennwerte nach Gruppen können der Tabelle 14.2 entnommen werden. 
Da kaum Normalverteilungen vorlagen (auf Basis von Shapiro-Wilk-Tests) und 
die Quantil-Quantil-Diagramme optisch auffällig waren, wurde der Schwerpunkt 
der multivariaten Auswertung auf robuste und nicht-parametrische Berechnungen 
gelegt. 

Die Hypothesen wurden in der bivariaten Betrachtung mit t-Tests überprüft. 
Es zeigten sich weder Geschlechts-Professions-Assoziation im Unterrichtsfach 
Deutsch (r(104) = 0.539, p; = .296; d = 0.105; 1-В = .134) noch im Unter- 
richtsfach Mathematik (r(122) = 0.456, р; = .325; d = 0.082; 1-6 = .117). 
Auch bei der Kompetenzbeurteilung männlicher (1(109) = 0.718, ру = .237; 
d = 0.137; 1-8 = .176) und weiblicher Lehrkräfte in Abhängigkeit von der 
Schulform (1(109.469) = 0.616, p; = .270; d = 0.113; 1-6 = .151) gab es keine 
signifikanten Unterschiede. Dies bedeutet, dass sowohl Frauen als auch Män- 
ner als Lehrkräfte über die Schulformen hinweg gleich kompetent beschrieben 
wurden. Außerdem war der Unterschied zwischen der Kompetenzbeurteilung für 
weibliche und männliche Grundschullehrkräfte nicht signifikant (t(106) = 0.063, 
pı = 475; d = 0.012; 1-6 = .057). Insgesamt erhielten männliche und weib- 
liche Lehrkräfte auch gleich hohe Kompetenzzuschreibungen (t(106) = 0.063, 
р = .950; а = 0.008; 1-8 = .050). Somit müssen auf Basis der bivariaten 
Betrachtungen alle aufgestellten Hypothesen abgelehnt werden. 

Zur Überprüfung der Hypothesen unter Berücksichtigung der Wärmebeurtei- 
lung sollte eine Kovarianzanalyse berechnet werden. Die Voraussetzungen dafür 
lagen jedoch nicht vor. Zum einen gab es Verletzungen der Normalverteilungs- 
annahme, wogegen varianzanalytische Verfahren allerdings robust sind (Harwell, 
2003; vgl. Bortz & Schuster, 2010), außerdem gab es eine interaktive Wirkung 
einer Kontrollvariablen (Wärmebeurteilung) mit einem Faktor (Schulform) auf die 
Kompetenzbeurteilung. Letzteres kann zu einer Verzerrung der Ergebnisse füh- 
ren (Huber et al., 2014). Deswegen wurde zur Hypothesenprüfung eine robuste 
Regressionsanalyse mit Bootstrap durchgeführt (vgl. Urban & Mayerl, 2018), in 
die die Variablen Geschlecht der Lehrkraft, Unterrichtsfach, Schulform und deren 
Interaktionsterme sowie die Wärmebeurteilung eingingen. 
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Tabelle 14.2 Mittelwerte, Standardabweichungen und Normalverteilungsiiberpriifungen 
der Skalen getrennt nach Gruppen (Studie 2) 


Kompetenzbeurteilung Warmebeurteilung 
Gruppe N M SD SW M SD SW 
Alle Gruppen 254 526 1.10 .95** 487 1.23 .96** 
Männliche LK 123 526 1.14 .94** 486 1.32 .94** 
Weibliche LK 131 525 1.07 .96** 4.89 1.14 .97** 
Deutsch-LK 117 508 120 .93** 4.78 1.35 .94** 
Mathematik-LK 137 540 100 .97** 496 1.11 .98* 
Grundschul-LK 121 5.18 1.20 .95** 482 1.37 .94** 
Gymnasial-LK 133 5.32 1.01 .95** 492 1.09 .97** 
Männliche Deutsch-LK 61 5.022 1.11 .95* 487 1.27 .95% 
Mannliche Mathematik-LK 70 544 1.00 .96* 490 1.03 98 
Weibliche Deutsch-LK 56 515 129 91** 469 143 93» 
Weibliche Mathematik-LK 67 5.36 1.00 .97 5.02 1.21 .96* 
Männliche LK in der Grundschule 64 5.19 1.18 .96 4.78 1.29 .96 
Männliche LK im Gymnasium 67 531 095 .94** 499 0.98 .96* 
Weibliche LK in der Grundschule 57 518 123 .93** 4.87 1.45 .90** 
Weibliche LK im Gymnasium 66 5.33 107 .94** 4.85 1.20 .97 
Männliche Deutsch-LK in der 31 4.87 1.17 .96 4.84 1.40 94 
Grundschule 
Mannliche Deutsch-LK im 30 5.19 1.04 .95 4.89 113 :92% 
Gymnasium 
Mannliche Mathematik-LK in der 33 549 1.14 94 472 1.19 .97 
Grundschule 
Mannliche Mathematik-LK im 37 5.40 0.89 95 5.05 0.86 .96 
Gymnasium 
Weibliche Deutsch-LK in der 32 5.05 140 .93* 4.59 1.59 .91% 
Grundschule 
Weibliche Deutsch-LK im 24 527 116 .80** 4.83 1.18 94 
Gymnasium 
Weibliche Mathematik-LK in der 25 5.35 0.96 .95 524 1.18 .87** 
Grundschule 
Weibliche Mathematik-LK im 42 5.37 1.03 95 4.87 1.22 .97 


Gymnasium 


Anmerkungen. N: teils geringfügige Abweichung aufgrund fehlender Werte möglich. 


Mittelwerte von 1 bis 7 möglich. SW 
LK = Lehrkraft. * p < .05. ** p < .01. 


Shapiro-Wilk-Test auf Normalverteilung; 
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Vorweg wurde eine Regressionsanalyse mit Bootstrap zur Uberpriifung einer 
Eigengruppenbevorzugung (Balliet et al., 2014; DiDonato et al., 2011; Rob- 
bins & Krueger, 2005) auf Basis der Geschlechtszugehörigkeit durchgeführt. 
In diese gingen das Geschlecht der beschriebenen Lehrkräfte und das der 
Proband*innen als Regressoren ein. Dabei ergaben sich weder signifikante 
Haupteffekte (Geschlecht der Lehrkraft: В = .138, рь = .649; Geschlecht der 
Proband*innen: В = —.031, py; = .058) noch eine signifikante Interaktion 
(В = .045, ры = .528; 5. Zusatzmaterial). Deswegen wurde das Geschlecht 
der Proband*innen nicht als Kontrollvariable in der explorativen multivariaten 
Regressionsanalyse berücksichtigt. 


Tabelle 14.3 Ergebnisse der Regressionsanalyse mit der Kompetenzbeurteilung als Regres- 
sand (Studie 2) 


Bootstrap* 

95 %-CI 
Variable B/B? p LL UL ры 
Konstante 0.000 1.000 —0116 0.115 1.000 
Haupteffekte 
Wärmebeurteilung 510 < .001 0.370 0.639 <.001 
Geschlecht der LKS —.032 586 —0.146 0.082 582 
Unterrichtsfach® .088 .139 —0.027 0.203 141 
Schulform® .039 514 —0.076 0.152 512 
Interaktionen 
Geschlecht der LK x Unterrichtsfach .088 .138 —0.026 0.205 .136 
Geschlecht der LK x Schulform —.050 402 —0.167 0.063 400 
Unterrichtsfach x Schulform —.068 .247 —0.181 0.043 235 
Geschlecht der LK x Unterrichtsfach —.015 .805 —0.128 0.097 .802 
x Schulform 
Modell R? = .289, korrigiertes R? = .261; 


F(8, 207) = 10.601, p < .001 


Anmerkungen. Toleranz (Minimum) = .964. N = 218. LK = Lehrkraft. * Boot- 
strap: Perzentile; N = 10000. ° Der standardisierte Regressionskoeffizient В 
entspricht aufgrund der vorherigen z-Transformierung aller Variablen dem unstan- 
dardisierten Koeffizienten B; für die Konstante und die Konfidenzintervalle ist 
B angegeben. © Codierung vor z-Transformation: 1 = männlich, 2 = weiblich. 
4 Codierung vor z-Transformation: 1 = Deutsch, 2 = Mathematik. ° Codierung vor 
z-Transformation: 1 = Grundschule, 2 = Gymnasium. 
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Die Ergebnisse der multivariaten Regressionsanalyse sind in Tabelle 14.3 
dargestellt. Insgesamt konnten 26 % der Varianz der Kompetenzbeurteilung auf- 
geklärt werden. Dies lag im Haupteffekt der Wärmebeurteilung (B = .510, 
p < .001) begründet, der in die gleiche Richtung wies wie die Korrelation 
(rs = .423, p < .001). Alle weiteren Regressoren sowie deren Interaktionen 
zeigten keinen signifikanten Zusammenhang mit der Kompetenzbeurteilung. 


144 Zusammenfassung, Interpretationen und 
Limitationen 


Mithilfe der zweiten Studie sollte eine zur ersten Untersuchung dieser Arbeit (s. 
Kapitel 13) zusätzliche Überprüfung von Geschlechts-Professions-Assoziationen 
bei Lehrkräften und somit von Substereotypisierungen vorgenommen werden. 
Außerdem sollte überprüft werden, ob Frauen im Grundschullehramt positi- 
ver resp. kompetenter beurteilt werden als Männer, da vermeintlich kommunale 
Eigenschaften bedeutsamer erscheinen. 

Weder das Geschlecht der Lehrkraft noch das Unterrichtsfach und die Schul- 
form konnten in der durchgeführten Studie mit textbasierten Fallvignetten 
bedeutsam die Kompetenzbeurteilung vorhersagen. Auch statistische Interak- 
tionen blieben aus. Somit sind alle aufgestellten Hypothesen zu verwerfen. 
Es zeigten sich keine klassischen Geschlechts-Professions-Stereotype für Lehr- 
kräfte — wie auch in den multivariaten Analysen der ersten Studie. Dies unterstützt 
die Interpretation der ersten Studie, dass lediglich wenige Unterrichtsfächer (z. B. 
Physik) mit männlichen oder weiblichen Lehrkräften assoziiert sind. 

Außerdem scheint auf Basis der hier erzielten Ergebnissen der Erziehungs- 
aspekt bei der Kompetenzbeurteilung von Lehrkräften keine Rolle zu spielen. 
Dies kann jedoch daran liegen, dass die Manipulation des Erziehungsaspekts 
innerhalb der Fallvignetten ungenügend war. Da in allen Fallvignetten eine 
Fachlehrkraft, auch in der Grundschule, beschrieben wird, kann die Beschrei- 
bung der Schulform — also Grundschule und Gymnasium, die unterschiedliche 
Anteile an Erziehungsaufgaben für Lehrkräfte innehaben - für die Beurteilung der 
Lehrkräfte irrelevant werden. Des Weiteren ist eine Fachlehrkraft in der Grund- 
schule eher untypisch, was die Imagination der Situation für die Proband*innen 
erschwert haben bzw. Irritationen ausgelöst haben könnte. 

Die Wärmebeurteilung stand in einem besonders hohen Zusammenhang mit 
der Kompetenzbeurteilung (rs = .423, p < .001) und dies in einem höheren 
Ausmaß als in Studie 1 (rs = .343, p < .001). Dies stützt die Interpretation, 
dass sympathisches und fürsorgliches Verhalten für Lehrkräfte einen besonderen 
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Kompetenzbereich darstellt. In Kompetenzmodellen für Lehrkräfte, z. B. im heu- 
ristischen Modell professioneller Handlungskompetenz COACTIV (Baumert & 
Kunter, 2006; Kunter et al., 2011), hat dieser Aspekt hingegen keine große 
explizite Bedeutsamkeit. Nichtsdestotrotz scheint es in der Lehrkräfteaus- und 
-weiterbildung lohnenswert zu sein, die Wärmedimension stärker zu berücksich- 
tigen, wie z. B. in Klassenführungstrainings (z. B. Kiel et al., 2013; Marzano 
et al., 2003; vgl. Haag, 2018). 

Die Limitationen gleichen denen der ersten Studie (s. Kapitel 13): Es wurde 
eine Gelegenheitsstichprobe herangezogen und die Proband*innen waren größ- 
tenteils Studierende und/oder aus dem psychosozialen Bereich. Dies begrenzt 
die Generalisierbarkeit (vgl. u. a. Bortz & Döring, 2016; Bühner, 2010). 
Außerdem wurden erneut ausschließlich kognitive Schemata von erwachsenen 
Proband*innen erfasst. Weitergehend waren die Items ausschließlich positiv 
gepolt. 

Basierend auf den Ergebnissen kann insgesamt resümiert werden, dass es keine 
bedeutsamen Subgruppen von Lehrkräften gibt, die die Kompetenzbeurteilung in 
einem hohen Ausmaß beeinflussen. Auch bei Zander et al. (2015) ergibt sich 
lediglich ein kleiner Effekt für das Geschlecht der Lehrkraft auf die Beurtei- 
lung der Physiklehrfähigkeit. Nichtsdestotrotz ergeben sich Streuungen in der 
Beurteilung der Kompetenz. Auf welchen kognitiven Schemata oder situativen 
Einflüssen diese Streuungen beruhen, kann hier nicht abschließend geklärt werden 
und bedarf weiterer Forschung. 


Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 Inter- 
national Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche 
die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem 
Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle 
ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, 
ob Änderungen vorgenommen wurden. 

Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen eben- 
falls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts 
anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Com- 
mons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt 
ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des 
jeweiligen Rechteinhabers einzuholen. 
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Studie 3 - Nonverbales Verhalten 1 5 
in Abhängigkeit von 
Kompetenzerwartungen 


15.1 Hypothesen 


Wenn Lehrpersonen eine Kompetenzerwartung an Lernende ausgebildet haben, 
wird diese über das Verhalten der Lehrpersonen an die Lernenden vermittelt 
(vgl. Brophy & Good, 1976; Nickel, 1985; Tauber, 1997). Schon Rosenthal und 
Jacobson (1971) argumentierten, dass sich Lehrkräfte, die eine*einen intellectual 
bloomer (schnellentwickelndes Kind) erwarteten, diesem Kind freundlicher und 
unterstützender begegneten. Diese Annahmen konnten meta-analytisch von Har- 
ris und Rosenthal (1985; Rosenthal, 1994; vgl. Ludwig, 2018) bestätigt werden, 
indem sie vier Faktoren als bedeutsam für die Vermittlung von Erwartungen aus- 
machten: die Atmosphäre (climate), das Feedback, den Input der Lehrpersonen 
und die Output-Möglichkeiten (s. Kapitel 6). 

Es gibt nur wenige Befunde zur Mediation der Lernendenkompetenzerwartun- 
gen an Lehrpersonen (s. Kapitel 11): Jamieson et al. (1987) konnten ausmachen, 
dass sich Schüler*innen adäquater und weniger störend verhielten, wenn sie eine 
kompetente und motivierte Lehrperson erwarteten. Die Proband*innen in der 
Galatea-Bedingung in der ersten Studie von Feldman und Prohaska (1979) zeig- 
ten (marginal signifikant) ein zugewandteres Verhalten (immediacy; d = 0.342). 
Unter den von ihnen betrachteten Variablen waren für diesen Trend das Vorbeu- 
gen (d = 0.974) und der Blickkontakt (d = 0.512) verantwortlich, während die 
räumliche Nähe (d = 0.187) und die seitliche Orientierung (d = —0.342) kaum 


Ergänzende Information Die elektronische Version dieses Kapitels enthält 
Zusatzmaterial, auf das über folgenden Link zugegriffen werden kann 
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eine Rolle spielten. Ähnliches Verhalten in Abhängigkeit der Kompetenzerwar- 
tung konnte auch bei Lehrpersonen gefunden werden (Chaikin et al., 1974; vgl. 
Harris & Rosenthal, 1985). 

Es ergibt sich also die Hypothese, dass sich Lernende mit hohen Kompe- 
tenzerwartungen (Galatea-Effekt) an Lehrpersonen im nonverbalen Verhalten von 
Lernenden mit geringen Kompetenzerwartungen an Lehrpersonen (Golem-Effekt) 
unterscheiden. Die bisherigen Befunde verweisen zwar auf ein zugewandteres 
Verhalten, wenn eine kompetente Person erwartet wird, aber die Studienergeb- 
nisse für das Lernendenverhalten sind rar und über 30 Jahre alt (Feldman & 
Prohaska, 1979; Jamieson et al., 1987), weswegen keine gerichteten Annahmen 
getroffen werden. Aus den genannten Befunden und Ableitungen ergeben sich 
folgende Hypothesen: 


Hypothesenkomplex: Lernende, die eine kompetente Lehrperson erwar- 
ten, verhalten sich hinsichtlich (1.) des Blickkontakts, 
(2.) des Vorbeugens, (3.) des Abstützens des Kopfes 
auf dem Arm, (4.) des Verschränkens der Arme, 
(5.) des Lächelns, (6.) des Stirnrunzelns, (7.) des Nickens 
und (8.) des Kopfschüttelns anders als Lernende, die eine 
inkompetente Lehrperson erwarten. 


Die Auswahl des relevanten nonverbalen Verhaltens basiert auf den Variablen, 
die Feldman und Prohaska (1979) untersuchten. Außerdem wurden ergänzende 
Verhaltensweisen betrachtet, um mehr Informationen zum Verhalten zu erhalten. 
So wurden das Abstützen des Kopfes auf dem Arm sowie das Verschränken der 
Arme als Gesten der Entspannung nach Mehrabian (1969) herangezogen sowie 
Nicken und Lächeln als Gesichtsausdruck (Chaikin et al., 1974; vgl. Mehra- 
bian, 1969). Nach Mehrabian (1969) ist die Zugewandtheit (immediacy) ein Set 
von Verhaltensweisen (u. a. Berührung, Abstand, Vorbeugen, Blickkontakt), das 
Sympathie für andere widerspiegelt, wenn die Person nicht angespannt ist. Die 
Entspanntheit (relaxation) ist das zweite Set von Verhaltensweisen (u. a. asym- 
metrische Arm- und Beinhaltung, seitliches Abstützen), das Mehrabian (1969) 
beschreibt, und mit Status assoziiert: Je höher die Entspanntheit ist, desto höher 
ist der Status im Vergleich zu der*dem Interaktionspartner*in. Darüber hin- 
aus wird, so Mehrabian (1969), die Einstellung zueinander in Interaktionen 
auch über Gesichtsausdrücke (u. a. Lächeln, Stirnrunzeln, Nicken, Kopfschütteln) 
kommuniziert. 

Zudem soll überprüft werden, ob sich in Abhängigkeit von den Kom- 
petenzerwartungen ein Lernzuwachs ergibt. Die Ergebnisse zum Lern- und 
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Leistungserfolg bzw. Wissenszuwachs in Abhängigkeit der Lernendenkompeten- 
zerwartungen an Lehrpersonen sind uneindeutig: Die meisten Studien berichteten 
einen Lernvorteil (u. a. bei Adediwura & Tayo, 2007; Edwards et al., 2009; Jamie- 
son et al., 1987; Reber et al., 2017), andere keinen (u. a. Lewandowski et al., 
2012; Towler & Dipboye, 2006) und ein paar Studien konnten teilweise einen 
Lernerfolg ausmachen, z. B. bei bestimmten Tests (privacy lesson; Feldman & 
Prohaska, 1979) und in bestimmten Bedingungen (bei schlechten Vorträgen; 
Leventhal et al., 1977). 


Hypothese 9: Lernende, die eine kompetente Lehrperson erwarten, erzielen ein 
besseres Ergebnis in einem Wissenstest als Lernende, die eine 
inkompetente Lehrperson erwarten. 


Da in der Studie mit Videomaterial gearbeitet wurde (s. u.), wird die Attrak- 
tivitätsbeurteilung aufgrund des „beauty is good“ stereotype (Dion et al., 1972; 
Eagly et al., 1991; Langlois et al., 2000) als Kontrollvariable herangezogen sowie 
auf Grundlage des stereotype content model (s. Kapitel 5) für die Wärmebeur- 
teilung kontrolliert. Aufgrund der Zusammenhänge zwischen der Kompetenz-, 
Wärme- und Attraktivitätsbeurteilung könnte in der bivariaten Überprüfung die 
Wirkung der Kompetenzmanipulation (s. u.) überschätzt werden: So zeigte sich 
п. а. in Studie 1, die die Wahrnehmung von Lehrkräften mithilfe von Fallvignetten 
mit Porträts überprüfte, dass weibliche Lehrkräfte kompetenter beurteilt wurden 
(а = 0.586). Unter Kontrolle der Wärme- und Attraktivitätsbeurteilung war 
der Effekt jedoch kleiner (np? = .057 entspricht d = 0.492). Zudem soll in 
multivariaten Analysen ein Interaktionseffekt zwischen Lernendenkompetenzer- 
wartungen und dem Geschlecht einer Lehrperson auf das nonverbale Verhalten 
der Lernenden und einen Wissenstest explorativ tiberpriift werden. 


15.2 Methodik 
15.2.1 Stichprobe 


An der Untersuchung nahmen insgesamt 71 Personen teil, von denen acht aus- 
geschlossen wurden, weil sie an der Cover-Story (s. u.) zweifelten, und eine 
weitere, weil diese Person große Schwierigkeiten mit der deutschen Sprache auf- 
wies. Somit ergab sich eine Stichprobe von 62 Proband*innen. Davon waren 
50 weiblich und zwölf männlich. Das Durchschnittsalter betrug 24.8 Jahre 
(SD = 8.94; Spannweite: 18-53). Der Großteil der Teilnehmenden studierte 
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(n = 53, davon 36 Psychologie und 9 Lehramt), neun Personen studierten nicht 
(mehr). 


15.2.2 Vorgehen 


Die experimentelle Laboruntersuchung erfolgte im Zeitraum vom 10.11.2016 bis 
zum 06.03.2017. Die Proband*innen wurden über Lehrveranstaltungen der Tech- 
nischen Universität Braunschweig, E-Mail-Verteiler für Psychologie-Studierende 
der Technischen Universität Braunschweig, über das elektronische Schwarze 
Brett der Technischen Universität Braunschweig, über Aushänge in Supermärkten 
und über einen Sportverein akquiriert. Bei der Akquise wurde die Cover- 
Story verwendet, es handle sich um eine Überprüfung einer skandinavischen 
Lehrkräfte-Supervisionsmethode in Deutschland. Die Proband*innen erhielten 
entweder 5 € Aufwandsentschädigung, die Möglichkeit, an einer Gutscheinver- 
losung im Wert von 20 € teilzunehmen, oder eine Versuchspersonenstunde im 
Rahmen des Psychologie-Studiums. 

Es wurden pro Durchgang bis zu vier Personen eingeladen, die zeitgleich 
im selben Raum teilnehmen konnten (Experimentalraum s. Abbildung 15.1). 
Durchschnittlich waren 1.82 Proband*innen (SD = 1.02) in insgesamt 39 Durch- 
gängen präsent. Durchgeführt wurden alle Durchgänge der Untersuchung vom 
gleichen Experimentator (Autor der Arbeit), der nicht blind gegenüber den 
Versuchsbedingungen war. Der Experimentator orientierte sich dabei an einem 
Leitfaden. 

Zu Beginn der Untersuchung wurde erneut die Cover-Story aufgegriffen und 
erklärt, dass die skandinavischen Länder in internationalen Schulvergleichsstu- 
dien sehr gut abschneiden würden, dort Supervisionen für Lehrkräfte stattfänden 
und dass das Ziel des Projekts die Überprüfung einer bestimmten skandinavischen 
Supervisionsmethode für Deutschland sei. Danach wurde auf die Freiwilligkeit, 
die (relative) Anonymität und den Datenschutz hingewiesen. 

Anschließend erfolgte eine kurze Agenda für das Vorgehen. Dabei wurde 
behauptet, dass es zwei Teile gebe. Zum ersten Teil wurde gesagt, dass die 
Lehrkraft einen Vortrag halten wird, der via Live-Stream in den Raum übertra- 
gen wird. Weitergehend wurde behauptet, dass die Lehrkraft die Teilnehmenden 
sehen wird, wofür drei Kameras aus unterschiedlichen Winkeln aufgebaut wur- 
den (links, rechts und unter dem Monitor; s. Abbildung. 15.1). Die Kameras, 
die das nonverbale Verhalten der Teilnehmenden erfassten, mussten gemäß der 
Cover-Story aus technischen Gründen Videos abspeichern, weswegen eine Ein- 
verständniserklärung der Proband*innen eingeholt wurde. Nach dem Einholen der 
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Abbildung. 15.1 Labor und Versuchsaufbau (Studie 3) 


Einverständniserklärung erhielten die Proband*innen ein vermeintliches Zeug- 
nis (Examenszeugnis und ein Arbeitszeugnis) der Lehrkraft (mit den Fächern 
Deutsch und Biologie). Über das Zeugnis wurde die Kompetenzerwartung mani- 
puliert: Entweder erhielten die Teilnehmenden ein sehr gutes Zeugnis (mit einer 
Examensnote von 1.3 und einem guten Arbeitszeugnis; Galatea-Bedingung) oder 
ein befriedigendes Zeugnis (mit einer Examensnote von 3.3 und einem mäßi- 
gen Arbeitszeugnis; Golem-Bedingung; Zeugnisse s. Zusatzmaterial). Während 
des Lesens wurden die Kameras eingeschaltet. Nahm nur eine einzelne Person 
an einem Durchgang teil, wurden anstatt der drei möglichen nur zwei Kameras 
eingeschaltet. 

Nach dem Lesen der Zeugnisse wurde der Vortrag der Lehrkraft angekündigt. 
Der Experimentator bat die Proband*innen, während des Vortrags nicht mitein- 
ander zu sprechen, und kündigte an, der Lehrkraft das Zeichen für den Start zu 
geben. Anschließend ging der Experimentator aus dem Raum, öffnete eine Tür in 
der Nähe und sagte, dass die Lehrkraft anfangen könne. Nach etwa 10-30 Sekun- 
den Wartezeit startete der Experimentator von außen ein Video im Raum, in dem 
die Proband*innen saßen, das über einen Laptop auf einem Monitor abgespielt 
wurde. Die Teilnehmenden saßen in einem Abstand zwischen 2.50 bis 3.50 Meter 
Entfernung zum Monitor und der Experimentator war während des Vortrags nicht 
im Raum. 
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Es wurde eines von zwei unterschiedlichen Videos mit einer vermeintli- 
chen Lehrkraft gezeigt. Untersuchungen zur Lehr-Lern-Interaktion mit Videos 
sind weitverbreitet (u. a. Edwards et al., 2009; Haefele, 1988; Lewandowski 
et al., 2012; Perry et al., 1979; Reavis, 1979; Towler & Dipboye, 2006). Die 
beiden Videos unterschieden sich inhaltlich nicht, in beiden ging es um das 
Thema Nägelkauen (Vortragstext in Anlehnung an Williams et al., 2006; s. 
Zusatzmaterial). Das Thema Nägelkauen wurde gewählt, weil davon ausgegangen 
wurde, dass hierzu wenig Vorwissen besteht. Die Videos unterschieden sich im 
Geschlecht der dargestellten Lehrkraft: Entweder wurde eine weibliche Lehrkraft 
gezeigt oder eine männliche (s. Abbildung 15.2). Dabei wurden beide Versionen 
von der gleichen Darstellerin eingesprochen, um persönliche Eigenschaften (z. B. 
Vortragsstil) konstant zu halten!. 


Abbildung 15.2 Konföderierte in der weiblichen (links) und der männlichen (rechts) 
Bedingung (Studie 3) 


Das Video der weiblichen Lehrkraft-Bedingung dauerte 27:09 Minuten und 
das der männlichen Bedingung 25:56 Minuten. Die Videos wurden mit einer 
Panasonic-Kamera (HDC-SD 800) aufgenommen und mit Shotcut 16 bearbeitet 
(Farb- und Helligkeitskorrekturen; Weichzeichnung; 36 Bilder/Sekunde) sowie 
geschnitten (Porträt, etwa Zwerchfell aufwärts; Auflösung von 1200 x 900 Pixel). 
Außerdem wurde die Stimmhöhe mit Audacity 2.1 jeweils in einen „androgynen“ 
Bereich verschoben. Dafür wurde ein circa einmütiger Ausschnitt der Audiospur 
zu Beginn der beiden Vortragsversionen bearbeitet, schrittweise in Seminaren des 
Instituts für Pädagogische Psychologie der Technischen Universität Braunschweig 


! Eine vorangehende Erprobung der Untersuchung mit einer weiblichen und einem männ- 
lichen trainierten Konföderierten wurde aufgrund unterschiedlicher Vortragsweisen und 
Unglaubwürdigkeit, die von Proband*innen geäußert wurden, abgebrochen. 
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überprüft und so lange weiterbearbeitet, bis eine ungefähre Gleichverteilung des 
geschätzten Lehrkraft-Geschlechts erzielt wurde (insgesamt wurden acht Semi- 
nare besucht mit 137 teilnehmenden Studierenden). Dadurch wurde die Tonhöhe 
der männlichen Version um 3.0 Halbtöne reduziert (Bewertung im letzten besuch- 
ten Seminar: 39 % (n = 7) für weiblich, 61 % (n = 11) für männlich) und die der 
weiblichen Version um 3.2 Halbtöne (Bewertung im letzten besuchten Seminar: 
42 % (п = 8) für weiblich, 58 % (п = 11) für männlich). Dies zeigt, dass die 
Darstellerin in der männlichen Version bereits tiefer sprach. Zusätzlich wurden 
der Pegel und die Lautstärke angepasst. 

Nach Ende des Vortrags ging der Experimentator wieder in den Raum und 
teilte einen Fragebogen aus. Dieser beinhaltete die Einschätzung der vermeint- 
lichen Lehrkraft, einen Wissenstest und Fragen zu soziodemografischen Daten. 
Danach wurden die Proband*innen über das Untersuchungsanliegen in vollem 
Umfang aufgeklärt und sie wurden gebeten, die genaue Fragestellung bis zum 
Ende der Untersuchung geheim zu halten. Außerdem wurden die Proband*innen 
gefragt, ob sie die Cover-Story glaubten, ob die aufgenommenen Videos von 
ihnen zum eigentlichen Zweck genutzt werden dürfen, und in der männlichen 
Bedingung, ob Zweifel am Geschlecht der Lehrkraft (erst offen, dann geschlos- 
sen) bestanden. Starke Zweifel an der Cover-Story äußerten acht Proband*innen 
und keine der teilnehmenden Personen zweifelte am Geschlecht der Lehrkraft in 
der männlichen Bedingung. Alle Proband*innen waren einverstanden, dass die 
Videos von ihnen im Rahmen der vorliegenden Arbeit genutzt werden dürfen. 

Insgesamt handelte es sich also um ein 2 x 2-Design, bei dem einerseits 
die Kompetenzerwartungen über die Zeugnisse manipuliert wurden sowie ande- 
rerseits das Geschlecht der Lehrkraft systematisch variierte. Zu Beginn der 
Untersuchung wurden die Bedingungen zufällig per Los bestimmt, im weiteren 
Verlauf wurde vermehrt auf eine gleiche Zellbesetzung Wert gelegt. Die Daten 
wurden mittels IBM SPSS Statistics 25 ausgewertet. 


15.2.3 Instrumente und Variablen 


Als abhängige Variablen wurden das nonverbale Verhalten der Proband*innen 
und das Wissen über Inhalte des Vortrags erfasst. Die Beurteilung der Kompetenz 
wurde als Manipulationsüberprüfung erfragt und zusätzlich wurden die Beurtei- 
lung der Wärme im Sinne des stereotype content model sowie die Beurteilung der 
Attraktivität aufgrund des „beauty is good“ stereotype als Kontrollvariablen für 
multivariate Analysen herangezogen (Fragebogen s. Zusatzmaterial). 
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Kompetenzbeurteilung: Die Einschätzung der Kompetenz wurde mittels der 
vier Adjektive der ersten und zweiten Studie (kompetent, effizient, fähig, intel- 
ligent) auf einer siebenstufigen Likert-Skala (1 = „stimme gar nicht zu“ bis 
7 = „stimme vollkommen zu“) erfasst. Die Reliabilität (Cronbachs Alpha) war 
mit а = .803 zufriedenstellend. 

Wärmebeurteilung: Die Einschätzung der Wärme wurde mit vier Adjektiven 
der ersten beiden Studien (warmherzig, gutmütig, wohlwollend, sympathisch) in 
der gleichen Liste wie die Kompetenzbeurteilung mit einer siebenstufigen Likert- 
Skala erfasst. Es konnte fiir die Warmebeurteilung eine gute interne Konsistenz 
mit einem Cronbachs Alpha von a = .796 erzielt werden. 

Attraktivitätsbeurteilung: Die Einschätzung der Attraktivität wurde wie in der 
ersten Studie mit folgendem Item auf einer siebenstufigen Likert-Skala (1 = „sehr 
unattraktiv“ bis 7 = „sehr attraktiv“) erhoben: „Wie optisch attraktiv empfinden 
Sie die Lehrkraft?“ 

Auf Grundlage der Ergebnisse der Studie 1 und 2 sowie aufgrund der kleinen 
Stichprobengröße (N = 62) wurde auf faktoranalytische Überprüfungen verzich- 
tet. Die internen Konsistenzen werden als ein Indiz für eine angemessene Passung 
betrachtet. 

Nonverbales Verhalten: Aspekte des nonverbalen Verhaltens wurden auf Basis 
von Mehrabian (1969) und bereits existierender Studien (Chaikin et al., 1974; 
Feldman & Prohaska, 1979; Ho & Mitchell, 1982) ausgewählt: Vorgebeugt 
sein (Zeit), gerade sitzend (Zeit), zurückgelehnt sitzend (Zeit), Kopf auf dem 
Arm abgestützt (Zeit), Arme verschränkt (Zeit), Blickkontakt zum Monitor 
(Zeit), Weggucken (Häufigkeit), Lächeln (Zeit und Häufigkeit), Stirnrunzeln 
(Zeit und Häufigkeit), Kopfnicken (Zeit und Häufigkeit) und Kopfschütteln (Zeit 
und Häufigkeit; Manual s. Zusatzmaterial). Von den Videos wurden jeweils 
164.4 Sekunden lange Ausschnitte kurz vor dem Ende des Vortrags (weibliche 
Bedingung: ab 26:57 Minuten; männliche Bedingung: ab 25:41 Minuten) aus- 
gewählt, in denen in der männlichen und weiblichen Lehrkraft-Bedingung der 
gleiche Inhalt präsentiert wurde. Das Ende wurde herangezogen, weil davon 
ausgegangen wurde, dass sich zu diesem Zeitpunkt die Proband*innen an die 
Situation (z. B. die Kameras) gewöhnt hatten. Außerdem zeigte sich in der 
Studie von Herrell (1971), dass nur zum Ende Unterschiede bezüglich der 
(Wärmeerwartungs-)Manipulation beobachtbar waren. Die Videoausschnitte wur- 
den dabei ohne Ton und mit 25 Bildern/Sekunde gespeichert. Die Bearbeitung 
und das Schneiden der Videos erfolgten mit Shotcut 16. 

Das nonverbale Verhalten wurde in einem ersten Schritt von zwei trainier- 
ten Auswerterinnen, die blind gegenüber der Fragestellung waren, beurteilt. 
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Dafiir wurde das Programm Avidemux 2.6 verwendet. Im Gegensatz zu Shot- 
cut ist Avidemux ressourcenschonender und einfacher in der Anwendung fiir 
die Auswertung. Aufgrund des Formats von 25 Bildern/Sekunde entsprach die 
Zeit von einem Bild zum nächsten 0.04 Sekunden. Im Anschluss daran wur- 
den die Ubereinstimmungen mittels Korrelationen und in Anlehnung an die 
Bland—Altman-Methode (Differenz der Mittelwerte darf nicht signifikant von 
null verschieden sein; vgl. Grouven et al., 2007) berechnet. Dabei zeichnete 
sich ab, dass einige Variablen kaum tibereinstimmend beurteilt wurden (gerade 
sitzend, zurückgelehnt sitzend, Lächeln, Stirnrunzeln) und andere Verhaltens- 
weisen kaum auftraten (Kopfnicken, Kopfschütteln), die dann von der weiteren 
Betrachtung ausgeschlossen wurden. Danach wurden in moderierten Gesprächen 
größere Abweichungen in den Auswertungen (Zeit: über 5 Sekunden; Häufig- 
keit: über 1 Mal) der übrigen Variablen diskutiert und ggf. angepasst. Am Ende 
konnten fünf Variablen mit hoher Übereinstimmung herangezogen werden: Vor- 
gebeugt sein (Zeit), Kopf auf dem Arm abgestützt (Zeit), Arme verschränkt (Zeit), 
Blickkontakt (Zeit) und Weggucken (Häufigkeit; s. Zusatzmaterial, inkl. Interra- 
terreliabilität). Als Werte für das Verhalten wurden die Mittelwerte der beiden 
Auswerterinnen herangezogen. 

Wissen: Das Wissen wurde mit zehn Fragen im Single Choice-Format erfasst. 
Von diesen zehn Fragen wurden zwei ausgeschlossen, da diese nicht exakt über 
den Vortrag beantwortbar waren bzw. nicht eindeutig formuliert wurden und ein 
weiteres Item aufgrund einer psychometrisch zu hohen Itemschwierigkeit (von 
mehr als 95 % richtig beantwortet; Kelava & Moosbrugger, 2020; Itemanalyse 
s. Zusatzmaterial). Somit war ein Testergebnis von 0 bis 7 möglich. Die Items 
hingen jedoch nicht bedeutsam untereinander zusammen (maximales Irl = .228, 
р = .075; Cronbachs Alpha: а = .244). 

Weitere Variablen: Zusätzlich zu den zentralen Variablen wurden soziodemo- 
grafische Daten erfasst. Außerdem wurden die Uhrzeit des geplanten Beginns 
des Untersuchungsdurchgangs und bisheriges eigenes Nägelkauen zur Kontrolle 
erfasst. Die Uhrzeit wurde berücksichtigt, weil sie (bzw. der zirkadiane Rhyth- 
mus) die kognitive Leistung und Konzentration beeinflussen kann (u. a. Blatter & 
Сајосћеп, 2007). Da das Untersuchungsmaterial das Thema Nägelkauen aufsriff, 
wurde außerdem das Nägelkauen der Proband*innen erfragt. 
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Die Kennwerte der Variablen sind in Tabelle 15.1, die Kennwerte nach Grup- 
pen in Tabelle 15.2 sowie die Korrelationen in der Tabelle 15.3 aufgelistet 
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Tabelle 15.1 Kennwerte der Variablen (Studie 3) 


Spannweite 

N Minimum Maximum М SD алсс“ SW 
Geschlecht der 62 1 2 1.81 0.40 48** 
Proband*innen® 
Alter der Proband*innen 62 18 53 24.79 8.94 12» % 
Nägelkauen (Gegenwart 60 0 1 0.33 0.48 .60** 
und/oder Vergangenheit)“ 
Kompetenzmanipulation® 62 1 2 1.48 0.50 .64** 
Geschlecht der Lehrkraft? 62 1 2 1.48 0.50 .64** 
Kompetenzbeurteilung® 61 1.50 7.00 5.32 1.23 80 .93** 
Warmebeurteilung® 62 2.00 7.00 4.94 1.04 .80 .98 
Attraktivitatsbeurteilung® 62 2.00 6.00 4.19 1.10 ОТЕ 
Blickkontakt! 62 70.37 164.40 140.68 19.90 1.00* .91** 
Weggucken 62 0.0 49.0 12.90 10.28 1.00* .89** 
Vorgebeugt! 62 0.00 164.40 20.69 51.01 1.00* .44** 
Kopf abgestützt! 62 0.00 164.40 41.66 60.46 1.00* .70** 
Arme verschrinkt! 62 0.00 164.40 26.11 54.85 1.00% .52** 
Wissenstest® 62 3 7 5.74 1.13 24 .87** 
Uhrzeit 62 9.00 19.00 13.51 3.24 .91%% 


Anmerkungen. SW = Shapiro-Wilk-Test auf Normalverteilung. * Cronbachs Alpha (а) 
für Fragebogenmaße und Intraklassenkorrelation (ICC; Two-Way-Random, absolute Uber- 
einstimmung, Durchschnitt) der Auswerterinnen fiir nonverbales Verhalten. ® Codierung: 
1 = männlich, 2 = weiblich. © Codierung: 0 = nein, 1 = ја. 3 Codierung: 1 = inkompe- 
tent, 2 = kompetent. © Mögliche Werte: 1-7. ! Einheit: Sekunden (max. 164.40). ë Mögliche 
Werte: 0-7. * p < .05. ** p < .01. 


(Itemanalysen s. Zusatzmaterial). Da kaum Normalverteilungen vorlagen (Sha- 
piro—Wilk-Test) und die Quantil-Quantil-Diagramme auffallig waren, wurde der 
Schwerpunkt der Auswertung auf robuste und nicht-parametrische Berechnungen 
gelegt. 

Für die bivariaten Analysen wurden Mann-Whitney-U-Tests herangezogen, 
da wenig Proband*innen teilnahmen und die Variablen häufig nicht normal- 
verteilt sind (s. Tabelle 15.2). Die Ergebnisse der Mann-Whitney-U-Tests sind 
in Tabelle 15.4 dargestellt. Es gab signifikante Unterschiede in den Bedingun- 
gen der Kompetenzmanipulation beim Blickkontakt, sowohl Dauer (U = 339.0, 
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p = .047; d = 0.521; 1—-ß = .504; Adjustierung”: p = .047) als auch Häufigkeit 
des Wegguckens (U = 321.0, p = .025; d = 0.594; 1—ß = .612; Adjustierung: 
p = .047). D. h., Teilnehmende in der Bedingung mit hohen Kompetenzerwar- 
tungen zeigten weniger Blickkontakt zum Monitor. Ein marginal signifikanter 
Effekt ergab sich beim Abstützen des Kopfes (U = 358.5, p = .059; d = 0.495; 
1—В = .464), wobei Proband*innen in der Galatea-Bedingung weniger lang den 
Kopf abstützten. Die Kompetenzmanipulation hatte keinen signifikanten Effekt 
auf die anderen Variablen des nonverbalen Verhaltens oder auf das Ergebnis im 
Wissenstest. Damit kann nur die Hypothese für den Blickkontakt angenommen 
werden. 


Tabelle 15.4 Ergebnisse der Mann—Whitney-U-Tests für das nonverbale Verhalten und den 
Wissenstest in Abhängigkeit der Kompetenzmanipulation (Studie 3) 


p 

U Z asymptotisch exakt 
Blickkontakt 339.0 —1.986 047 047 
Weggucken 321.0 —2.241 .025 .025 
Vorgebeugt 412.0 —1.440 .150 .175 
Kopf abgestützt 358.5 —1.890 ‚059 059 
Arme verschrankt 425.5 —0.998 318 324 
Wissenstest 415.0 —0.951 342 (pı = .171) .349 (ру = .174) 


Anmerkungen. N = 62. 


Zur Uberpriifung der Hypothesen unter Beriicksichtigung von Kontrollvaria- 
blen wurden robuste Regressionsanalysen mit Bootstrap (vgl. Urban & Mayerl, 
2018) berechnet. Aufgrund der Verteilung der Variablen Vorgebeugt sein (von 
11 Personen gezeigt), Kopf abgestiitzt (von 27 Personen gezeigt) und Arme 
verschränkt (von 16 Personen gezeigt) wurden fiir diese binär logistische 
Regressionsanalysen berechnet (Verhalten wurde gezeigt oder nicht gezeigt). 
Anzumerken ist, dass fiir diese logistischen Regressionsanalysen die geforderte 
Fallanzahl von mindestens 25 je Gruppe (aufseiten der abhängigen Variablen; vgl. 
Backhaus et al., 2016) unterschritten wurde. Für die Dauer des Blickkontakts, 
die Häufigkeit des Wegguckens und das Ergebnis im Wissenstest wurden lineare 
Regressionen mit Bootstrap berechnet. In allen Regressionsanalysen waren die 


? Signifikanzadjustierung nach Benjamini und Hochberg (1995) mit dem Online-Tool von 
Hemmerich (2016). 
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Kompetenzmanipulation und das Geschlecht der Lehrkraft sowie deren Inter- 
aktion die Regressoren. Die Attraktivitäts- („beauty is good“ stereotype) und 
Warmebeurteilung (stereotype content model) sowie die Uhrzeit (aufgrund des zir- 
kadianen Rhythmus; u. a. Blatter & Cajochen, 2007) wurden als Kontrollvariablen 
beriicksichtigt. 

Es zeigten sich signifikante Korrelationen zwischen dem Alter (rs = .308, 
p = .016) und dem Geschlecht der Proband*innen (rs = —.343, p = .006) mit 
der Kompetenzmanipulation, sodass die älteren häufiger in der Galatea-Bedingung 
waren und die weiblichen Teilnehmenden häufiger in der Golem-Bedingung. In den 
Korrelationsanalysen zeigte sich auch, dass das Alter und das Geschlecht der Pro- 
band*innen zusammenhingen (rs = —.375, p = .003), dass also die teilnehmenden 
Frauen jünger waren als die Männer. Außerdem nahmen die älteren Proband*innen 
zu einer späteren Tageszeit teil als die jüngeren (rs = .375, p = .003). Deswegen 
wurde das Alter der Proband*innen als zusätzliche Kontrollvariable in den Regres- 
sionsanalysen berücksichtigt. Das Geschlecht wurde jedoch aufgrund der kleinen 
männlichen Stichprobe (n = 12) nicht als Kontrollvariable berücksichtigt. Es gab 
keine signifikanten Zusammenhänge mit dem eigenen regelmäßigen Nägelkauen (in 
der Vergangenheit oder in der Gegenwart) mit einer der abhängigen Variablen, wes- 
wegen das МавеЈкаџеп nichtals Kontrollvariable in das Modell aufgenommen wurde. 

Regressionsanalytisch (s. Tabelle 15.5 und Tabelle 15.6) zeigte sich, dass 
insgesamt wenig Varianz des nonverbalen Verhaltens aufgeklärt werden konnte 
(korrigiertes R? < 102; Nagelkerkes R< .210). Ein signifikanter Effekt für die 
Kompetenzmanipulation ergab sich beim Weggucken (Häufigkeit; B = .346, 
ры = .015; Adjustierung: р = .030) sowie marginal signifikante Effekte beim 
Blickkontakt (Zeit; В = —.240, рь = .079; Adjustierung: р = .079) und beim 
Abstützen des Kopfes (ОК = 0.550, рь = .074). Unter der Berücksichtigung 
der kleinen Stichprobe (N = 62) können also bei Annahme von marginal signi- 
fikanten Ergebnissen (vgl. Hager, 2004) die Hypothesen 1 und 3 unter Vorbehalt 
angenommen werden. 

Zusätzlich zu den hypothesenprüfenden, multivariaten Regressionsanalysen 
wurde explorativ die Beurteilung der Kompetenz als Regressand betrachtet, da 
diese sich zwischen der Galatea- und der Golem-Bedingung nicht unterschied 
(U = 389.0, Pexakt = .281), was jedoch zu erwarten gewesen wäre. Es zeigte 
sich, dass nur die Wärmebeurteilung ein signifikanter Regressor für die Kom- 
petenzbeurteilung war (B = .509, ppr < .001), die Kompetenzmanipulation aber 
nicht (В = .509, ру—ь = .332; s. Zusatzmaterial). 
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15.4 Zusammenfassung, Interpretationen und 
Limitationen 


Die dritte Studie widmete sich dem Einfluss der Kompetenzerwartungen auf 
das nonverbale Verhalten. Mit einem experimentellen Design, in dem die Kom- 
petenzerwartungen systematisch manipuliert wurden, zeigte sich, dass positive 
Kompetenzerwartungen (Galatea-Bedingung) mit weniger Blickkontakt — sowohl 
zeitlich kürzer als auch häufigerem Abbruch des Blickkontakts — und (margi- 
nal signifikant) weniger langem Abstützen des Kopfes einhergehen. Dies weist 
auf unterschiedliches Verhalten in Abhängigkeit der Kompetenzerwartung hin, 
widerspricht jedoch die bisherigen Befunde, die zeigten, dass Personen sich zuge- 
wandter verhalten, wenn sie eine kompetente Lehrperson erwarten, im Vergleich 
zu Personen, die eine inkompetente Lehrperson erwarten. 

Ein zugewandteres Verhalten Lernender bei höheren Lernendenkompetenzer- 
wartungen an Lehrpersonen konnte von Feldman und Prohaska (1979) ausge- 
macht werden. Für die Dauer des Blickkontakts ergab sich ein mittlerer Effekt 
(d = —0.521), bei Feldman und Prohaska (1979) zeigte sich ein ähnlicher Effekt 
(d = .512), allerdings in entgegengesetzter Richtung (mehr Blickkontakt bei der 
Galatea-Bedingung). Die Effektstärke bezüglich des Vorbeugens fällt auch ent- 
gegengesetzt und zusätzlich geringer aus (d = —0.372) als der Unterschied, der 
bei Feldman und Prohaska (1979) beschrieben ist (d = 0.974), was auch auf das 
unterschiedliche Erhebungsverfahren zurückführbar sein kann. So erfassten Feld- 
man und Prohaska (1979) den genauen Grad des Vor- und des Zurückbeugens. 
Darüber hinaus gab es bei Feldman und Prohaska (1979) dyadische Interaktio- 
nen, in der hier durchgeführten Studie haben ein bis vier Proband*innen pro 
Untersuchungsdurchgang eine videografierte Lehrperson erlebt. 

Die teilweise widersprechenden Ergebnisse zum nonverbalen Verhalten könn- 
ten mit zwei unterschiedlichen Motivationszuständen resp. mittels zweier „Lan- 
geweileprofile“ erklärt werden: So lag bei Feldman und Prohaska (1979) eine 
dyadische Face-to-Face-Interaktion vor, die vermutlich aktivierender ist als das 
Betrachten eines Monitors wie in der hier durchgeführten Studie. Es kann ver- 
mutet werden, dass in einem aktivierenden Setting Lernende ihr Desinteresse, 
das durch die Kompetenzerwartungen beeinflusst sein kann, durch Zurückleh- 
nen, seitliches Eindrehen und Weggucken signalisieren. Bei einem monotonen 
Vortrag könnte sich Desinteresse der Zuhörenden in ein „einsinkendes“ Verhalten 
(z. B. Kopf auf dem Arm abgestützt) abbilden. Das Abstützen des Kopfes auf den 
Armen kann als entspannte Haltung (relaxation) interpretiert werden, was nach 
der Theorie von Mehrabian (1969) mit Status assoziiert ist. Personen mit höherem 
Status zeigen nach Mehrabian (1969) eine entspanntere Körperhaltung, sodass im 
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Fall von Lernenden eine entspanntere Körperhaltung so interpretiert werden kann, 
dass die Lernenden die jeweilige Lehrperson nicht als Expert*in wahrnehmen und 
somit nicht ernst nehmen. Sowohl das aktivierende Face-to-Face- als auch das 
monotone Vortragssetting haben dann gemeinsam, dass Lernende in der Galatea- 
Bedingung eine Haltung mit mehr Muskeltonus zeigen, nur wird beim Vortrag 
weitere Stimulation für kurze Zeit außerhalb des Settings gesucht (Weggucken), 
was wiederum zu einer Reduzierung von Müdigkeit führen könnte. 

Das Geschlecht der Lehrperson hat in dieser Studie keinen signifikanten Effekt 
auf das nonverbale Verhalten und auch keinen bedeutsamen Effekt auf den Wis- 
senstest. Dies kann auf eine geringe Bedeutung des Lehrpersonengeschlechts in 
der Lehr-Lern-Interaktion hinweisen (Basow et al., 2013; Bavishi et al., 2010; 
Goebel & Cashen, 1979; Riniolo et al., 2006; s. auch Studie 1 und Studie 2). 
Allerdings kann dies auch daran gelegen haben, dass das Videomaterial in der 
männlichen Bedingung eine weniger stereotype „maskuline“ Person darstellte und 
somit als wenig repräsentativ für die Kategorie „Mann“ wahrgenommen wurde. 

Dass die Kompetenzmanipulation keinen Einfluss auf die Kompetenzbeurtei- 
lung am Ende des Vortrags hatte, kann darauf hinweisen, dass die Erfassung 
der Kompetenzbeurteilung einem subjektiven Maßstab folgt, sodass sich eine 
Form des shifting standards (Biernat et al., 1991; Foschi, 2000) zeigte. Ursprüng- 
lich wurde die shifting standards theory herangezogen, um die Bewertung von 
Mitgliedern unterschiedlich stereotypisierter Gruppenmitglieder zu erklären. Bei- 
spielsweise wird mit subjektiven Maßstäben (Skala von „sehr klein“ bis „sehr 
groß“) die Körpergröße von Männern und Frauen ähnlicher beschrieben als mit 
objektiven (Schätzung in Zentimetern). Erklärt werden kann dies damit, dass 
bei subjektiven Maßstäben andere Vergleichsgruppen herangezogen werden, also 
Frauen werden mit anderen Frauen verglichen und Männer mit anderen Männern. 
Für die erzielten Studienbefunde heißt dies, dass in der Galatea-Bedingung ein 
höherer Standard bei der Kompetenzbewertung angelegt wurde als in der Golem- 
Bedingung. Eine Lehrperson, deren Examen mit „sehr gut“ bewertet wurde, wird 
anhand dieser Note subjektiv bewertet. So können z. B. Gedanken gewesen sein, 
dass die Lehrperson für „sehr gut“ nicht „gut genug“ im Vortrag war — ana- 
log könnte die Lehrperson mit der Note „befriedigend“ als „besser als erwartet“ 
erachtet worden sein, was zu positiveren subjektiven Bewertungen geführt haben 
könnte. Eine Beurteilung der Kompetenz durch eindeutig objektive Maße zur 
Überprüfung der Kompetenzmanipulation müsste in ähnlich angelegten Studien 
künftig berücksichtigt werden. 

Weiterhin methodisch kritisch anzumerken ist zum einen die kleine 
Proband*innen-Zahl (N = 62; wegen fehlender Werte 61 für die Regressions- 
analysen) und die damit einhergehende geringe statistische Power (vgl. Döring & 


120 15 Studie 3 


Bortz, 2016; Hager, 2004). Dies steht aber in Relation zum sehr aufwendigen 
Studiendesign und der aufwendigen Auswertung der Videos. Die Auswertung 
der aufgezeichneten Videos wurde zusätzlich durch die Perspektive der Kameras 
beeinträchtigt. So waren einige Verhaltensweisen nicht eindeutig zu beobachten 
(z. B. Zurücklehnen) und die bei Feldman und Prohaska (1979) vorgenommenen 
Maßeinheiten (z. B. Körperorientierung in Grad) konnten hier nicht verwendet 
werden. Darüber hinaus unterschieden sich die Kompetenzbedingungen hinsicht- 
lich der Proband*innen-Zusammensetzung: So gab es mehr männliche und mehr 
ältere Proband*innen in der Galatea-Bedingung, was zu Konfundierungen geführt 
haben könnte (vgl. u. a. Döring und Bortz, 2016) — wobei das Alter in den 
multivariaten Analysen als Kontrollvariable berücksichtigt wurde, das Geschlecht 
aufgrund der sehr geringen männlichen Teilnehmendenzahl (n = 12) nicht. 
Außerdem sind Versuchsleitungseffekte (Klein et al., 2012; Rosenthal, 1966, 
2009; Rosenthal & Fode, 1973) nicht auszuschließen, wobei diesen mit einem 
Leitfaden für das Vorgehen begegnet wurde. 

Eine besonders wichtige Einschränkung, die Beachtung finden muss, ist, dass 
die Cover-Story (Supervision von Lehrkräften) die Proband*innen nur indirekt 
in eine Lernendenposition brachte. Die Proband*innen hatten nicht die Aufgabe, 
die Inhalte des Vortrags zu lernen, sondern die Lehrperson zu bewerten. Dies 
könnte erklären, warum es keine signifikanten Unterschiede im Wissenstest zwi- 
schen der Golem- und Galatea-Bedingung gab. Weitergehend ist einschränkend 
anzumerken, dass aufgrund der fehlenden Testung zum Vorwissen es unklar ist, 
ob die Proband*innen nicht doch einen höheren Wissenszuwachs in der Galatea- 
Bedingung hatten. Für das nonverbale Verhalten jedoch sollte sich aufgrund der 
Cover-Story kein Unterschied ergeben, da Lernende auch immer die Lehrper- 
sonen sowie das Unterrichtsangebot (bewusst oder unbewusst) evaluieren und 
bewerten (vgl. Nickel, 1985). Um dies jedoch mit Sicherheit aussagen zu können, 
bedarf es weitergehender Untersuchungen. 

Positiv an der Studie sind jedoch folgende Punkte hervorzuheben: Es han- 
delte sich um ein experimentelles Vorgehen, sodass Kausalaussagen möglich sind. 
Neben der Galatea- und der Golem-Bedingung wäre eine Kontrollgruppe (ohne 
Erwartungsmanipulation) sinnvoll gewesen, was jedoch eine größere Stichprobe 
erfordert hätte. Weitergehend wurden keine üblichen Selbsteinschätzungsverfah- 
ren genutzt, sondern Verhaltensmaße betrachtet. Verhaltensbeobachtungen haben 
gegenüber Befragungen eine Reihe von Vorteilen, werden jedoch aufgrund des 
Aufwands deutlich seltener genutzt (s. u. a. Döring & Bortz, 2016), obwohl sie 
„in besonderem Maße dem Anspruch der Psychologie gerecht [werden], mensch- 
liches Verhalten und Erleben zu beschreiben und zu erklären“ (Weber, 2012, 
S. 34). 
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Die bisherigen drei Studien waren Laboruntersuchungen, um Annahmen des 
transaktionalen Modells von Nickel (1985; s. Kapitel 7) zu Ursachen und Aus- 
wirkungen kognitiver Schemata in Kausalanalysen zu betrachten. In der finalen 
vierten Studie sollen die Überlegungen zur Wirkung von Lernendenkompeten- 
zerwartungen an Lehrpersonen im realen Lehr-Lern-Setting in einer Feldstudie 
untersucht werden. 
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Studie 4 - Lernendenerwartungen als 1 6 
Einfluss auf die Lehr-Lern-Situation 


Die vierte Studie wurde in Lehrveranstaltungen einer Hochschule durchgefiihrt, 
an der sowohl Studierende als auch Dozierende teilnahmen. Eine geplante Unter- 
suchung in allgemeinbildenden Schulen, um Ergebnisse im schulischen und 
universitären Kontext vergleichen zu können, konnte leider nicht realisiert wer- 
den. Die Studie wurde aufgrund der geplanten zeitlich parallelen Erhebungen 
in Schulen und Universität so angelegt, dass sie auch mit Jugendlichen im 
Schulkontext hätte durchgeführt werden können. 


16.1 Hypothesen 


Nachdem die dritte Studie einen weiteren Einblick in die Wirkung von Kom- 
petenzerwartungen auf das Verhalten der Lernenden gibt und zusammen mit 
den Studien von Feldman und Prohaska (1979) sowie Jamieson et al. (1987) 
geschlussfolgert werden kann, dass sich das Verhalten von Lernenden an ihre 
Kompetenzerwartungen an Lehrpersonen anpasst, sollen in einem weiteren Schritt 
Zusammenhänge in einer Feldstudie betrachtet werden. In den bisherigen Befun- 
den konnte gezeigt werden, dass Lernende, die eine Lehrperson für kompetent 
halten, diese positiver bewerten (Feldman & Prohaska, 1979; Feldman & Thiess, 
1982; Lewandowski et al., 2012; Reavis, 1979; Reber et al., 2017; Towler & 
Dipboye, 2006), den Unterricht interessanter finden (Feldman & Prohaska, 1979; 
Feldman & Theiss, 1982), sich wohler fühlen (positiver Affekt; Edwards et al., 
2009) und motivierter waren, an einer potenziellen Lehrveranstaltung dieser Lehr- 
person teilzunehmen (Kowai-Bell et al., 2011, 2012). Die Zusammenhänge der 
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Lernendenkompetenzerwartungen mit dem erwiinschten Erleben sollen repliziert 
werden, sodass folgende Hypothesen aufgestellt werden: 


Hypothesenkomplex 1: Lernende, die eine Lehrperson beim ersten Eindruck 
für kompetenter halten, unterscheiden sich von Ler- 
nenden, die eine Lehrperson für weniger kompetent 
halten, in einer Lehrveranstaltungssitzung beim Erle- 
ben von (1.) Freude, (2.) Frustration und Unsicherheit, 
(3.) Langeweile, (4.) Interesse und (5.) Störungen. 
Außerdem bewerten sie die Lehrperson hinsichtlich 
(6.) Kompetenz, (7.) Wärme, (8.) Klassenführung und 
(9.) Beziehungsgestaltung anders als Lernende, die eine 
Lehrperson für inkompetent halten. 


Zusätzlich zu bisherigen Studien sollen sowohl die Individual- als auch die Grup- 
penebene berücksichtigt werden (s. Kapitel 11). Die Hypothesen beziehen sich 
auf beide Ebenen. Da es bei der gemeinsamen Betrachtung der beiden Ebenen zu 
unterschiedlichen Ergebnissen kommen kann (z. B. positiver Zusammenhang auf 
Gruppenebene, aber negativer auf Individualebene; vgl. u. a. Eid et al., 2017), 
sind die Hypothesen ungerichtet. 

Die Befunde zu den Wirkungen von Lernendenkompetenzerwartungen auf 
die Lehrpersonen sind — wie bereits an vielen Stellen erwähnt — sehr rar. So 
berichteten Lehrpersonen, die sich eine Lehrsituation vorstellten, sich wohler im 
Umgang mit Lernenden zu fühlen, wenn sie glaubten, die Lernenden bewer- 
teten die Lehrperson positiv (Kowai-Bell et al., 2012). Weitergehend wurden 
vermeintlich warme Lehrpersonen am Ende eines Vortrags von unabhängigen 
Beobachter*innen (ohne Erwartungen) positiver bewertet (Herrell, 1971). Beson- 
ders hervorzuheben sind allerdings die Ergebnisse von Feldman und Prohaska 
(1979), die zeigten, dass das von ihnen gefundene prototypische (zugewand- 
tere) Verhalten von Lernenden dazu führte, dass sich die Lehrpersonen fröhlicher 
(d = 0.845), wärmer (d = 1.171) und weniger unzufrieden (d = 0.760) fühl- 
ten. Außerdem beurteilten sie die Lernenden als enthusiastischer (d = 1.923) 
und sympathischer (d = 1.076). Beim nonverbalen Verhalten der Lehrperso- 
nen gab es keine signifikanten Unterschiede. Bei Feldman und Theiss (1982) 
stellte sich jedoch kein Effekt der Lernendenkompetenzerwartungen auf die 
Lehrpersonen ein. Drei von vier Studien liefern Indizien für einen spezifi- 
schen Einfluss, allerdings sind aufgrund der wenigen Befunde die folgenden 
Zusammenhangshypothesen ungerichtet: 
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Hypothesenkomplex 2: Lehrpersonen, die im Mittel beim ersten Eindruck für 
kompetenter gehalten werden, erleben ein anderes Aus- 
maß an Emotionen, sowohl (1.) positive als auch (2.) 
negative, (3.) an Flow, (4.) der eigenen Kompetenz und 
(5.) Wärme. Außerdem unterscheiden sie sich in der 
Bewertung (6.) der Störungswahrnehmung, (7.) der 
eigenen Klassenführung und (8.) Beziehungsgestaltung 
von Lehrpersonen, die im Mittel beim ersten Eindruck 
für weniger kompetent gehalten werden. 


Zur Bewertung des Verhaltens und des Unterrichts werden u. a. Variablen, die im 
Kontext von Klassenführung im weiten Sinne (vgl. Hannemann, 2020; Helmke, 
2017) Verwendung finden, herangezogen. Klassenführung umfasst nach Helmke 
und Helmke (2014, S. 9) „Konzepte, Strategien und Techniken, die dem Ziel 
dienen, einen störungsfreien und reibungslosen Unterrichtsverlauf zu ermögli- 
chen und damit aktive Lernzeit zu maximieren: durch Regeln und Prozeduren, 
die Allgegenwärtigkeit der Lehrkraft, den Aufbau erwünschten Verhaltens und 
einen angemessenen Umgang mit Störungen“. Klassenführungskompetenz ist 
ein wichtiger Kompetenzbereich für Lehrpersonen (vgl. u. a. Baumert & Kun- 
ter, 2006; Hannemann, 2020; Helmke, 2017; Kunter et al., 2011). Insbesondere 
der Aspekt der Störungswahrnehmung wird in der durchgeführten Untersuchung 
fokussiert, weil dies als Marker für die (bewusste und unbewusste) Nutzung 
des Unterrichtsangebots (vgl. Angebots-Nutzungs-Modelle; Helmke, 2017; Reus- 
ser & Pauli, 2010) bewertet werden kann, ohne Lernerfolge heranzuziehen, die 
auch zu Beginn einer Lehrveranstaltung noch nicht vorliegen (können). So redu- 
zieren Störungen die aktive Lernzeit, die für den Lernerfolg wichtig ist (vgl. 
Helmke, 2017). 

Analog zu den bisherigen Studien sollen die Zusammenhangsanalysen auch 
mit den Kontrollvariablen Wärmebeurteilung, die der Kompetenzbeurteilung vor- 
ausgeht (stereotype content model; s. Kapitel 5), und der Attraktivitätsbeurteilung 
(„beatuy is good“ stereotype; Dion et al., 1972; Eagly et al., 1991; Langlois et al., 
2000) explorativ betrachtet werden. 
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16.2 Methodik 
16.2.1 Stichprobe 


Es wurden 42 Lehrveranstaltungen der Technischen Universität Braunschweig 
besucht und sowohl Studierende als auch Dozierende befragt. In den 42 unter- 
suchten Veranstaltungen nahmen 41 Dozierende teil. Von den 41 Dozierenden 
gaben 15 an, männlich zu sein, 25, weiblich zu sein, und eine Person machte 
keine Angabe zu ihrem Geschlecht. Sie waren im Durchschnitt zum Zeitpunkt 
der Teilnahme 38.9 Jahre alt (SD = 11.35; Spannweite: 26-62; 3 ohne Angabe) 
und lehrten (teils geschätzt) 16.2 Semester (SD = 13.7; 2 ohne Angabe). 

Insgesamt liegen 997 Datensätze von Studierenden vor, die ihre Dozieren- 
den und die jeweilige Lehrveranstaltung beurteilten. Proband*innen, die zu 
einem der zwei Erhebungszeitpunkte (s. u.) keinen Fragebogen ausgefüllt haben, 
wurden für die Auswertungen nicht berücksichtigt. Dadurch verblieben 871 
Datensätze. Durchschnittlich gab es 20.7 studentische Angaben pro Lehrveran- 
staltung (SD = 13.8; Spannweite: 7-78). Mehrfachteilnahmen von Studierenden 
waren möglich, wenn sie mehr als eine der untersuchten Lehrveranstaltungen 
besuchten. 

Auf Basis aller Datensätze inklusive Mehrfachteilnahmen (N = 871): Die 
Studierenden waren im Mittel 22.7 Jahre alt (SD = 4.08; Spannweite: 18-58), 
wobei 33 keine Angabe machten. Es gaben 221 Studierende an, männlich zu sein 
(25 %), und 612 der Befragten waren weiblich (70 %). Eine andere Geschlechts- 
identität gaben sechs Personen an und 32 machten keine Angabe. Die meisten 
(n = 537, 62 %) studierten primär Fächer der Geistes- und Erziehungswissen- 
schaften. 

Werden nur die eindeutigen Erstteilnahmen (N = 663; 76 % aller Teil- 
nahmen) berücksichtigt, ergibt sich ein ähnliches Bild: Die Studierenden 
waren im Mittel 22.6 Jahre alt (SD = 4.00; Spannweite: 18-58), wobei 
14 keine Angabe machten. Es gaben 161 Studierende an, männlich zu 
sein (24 %), und 476 der Befragten waren weiblich (72 %). Eine andere 
Geschlechtsidentität gaben fünf Personen an und 21 machten keine Angabe. 
Die Mehrheit (n = 398; 60 %) studierte primär Fächer der Geistes- und 
Erziehungswissenschaften. Die Angaben der Erstteilnahmen unterschieden sich 
bezüglich der Geschlechtsaufteilung (männlich oder weiblich; va) = 2.191, 
р = .139, ф = .051 = rs), des Alters (t(836) = 1.314, p = .189; d = 0.109 
entspricht r = .054) und des Anteils der Studierenden im Bereich der Geistes- 
und Erziehungswissenschaften (x?(1) = 7.420, p = .006, ф = —.095 = rs) 
nicht bedeutsam (Irl > .10 für einen kleinen Effekt; Cohen, 1988) von den 


16.2 Methodik 127 


Angaben, die mindestens ein zweites Mal (bei Mehrfachteilnahme) oder ein 
unbekanntes Mal (ohne Angabe bisheriger Teilnahmen) gemacht wurden. Zudem 
ist theoretisch nicht davon auszugehen, dass die Angaben der Proband*innen bei 
freiwilliger Mehrfachteilnahme die Ergebnisse verzerren. Deswegen werden für 
die hypothesenprüfenden Analysen alle Datensätze (N = 871) herangezogen. 


16.2.2 Vorgehen 


Die Lehrveranstaltungen wurden zu Beginn des Sommersemesters 2018 sowie 
Wintersemesters 2018/19 in der maximal fünften Lehrveranstaltungssitzung 
besucht. Der Beginn einer Lehrveranstaltung wurde gewählt, weil sich dann Kom- 
petenzerwartungen besonders bedeutsam zeigen (vgl. Jussim und Harber, 2005; 
Raudenbusch, 1984). Zum Start der Sitzung wurden die Studierenden über die 
Freiwilligkeit, die Anonymität und den Datenschutz aufgeklärt. Zudem wurde 
beschrieben, die Studie würde sich mit der „Wahrnehmung von Klassenführungs- 
variablen in der Hochschule“ beschäftigen. Die Studierenden sollten anschließend 
einen ersten Fragebogen beantworten, in dem retrospektiv der erste Eindruck von 
der Lehrperson erfasst wurde sowie die Beurteilung der aktuellen Attraktivität 
der Lehrperson. 

Das retrospektive Erfragen ist unter der Bedingung, dass der erste Ein- 
druck recht stabil ist (vgl. Schweer, 2019), eine Methode zur Erfassung der 
Kompetenzerwartung, die jedoch Schwächen aufweist. So kann die Stabilität 
der Repräsentation auch auf Erwartungseffekte, also selbsterfüllende Prophe- 
zeiungen, und damit auch über das Streben nach kognitiver Konsistenz (vgl. 
Kruglanski et al., 2018) zurückzuführen sein. Studien zur Akkuratheit retrospek- 
tiver Instrumente zur Erfassung interpersonaler Kompetenzerwartungen konnten 
nicht detektiert werden. Da für Feldstudien in Schulen und Hochschulen die 
Lernendenkompetenzerwartungen an Lehrpersonen nicht bzw. nur unter sehr 
kontrollierten und besonderen Bedingungen zeitnah zum Moment des ersten Ein- 
drucks erfasst werden können, mussten sie retrospektiv erhoben werden. Ob dies 
die tatsächlichen Kompetenzerwartungen des ersten Eindrucks widerspiegelten, 
bleibt offen, jedoch ist anzunehmen, dass potenzielle kognitive Verzerrungen 
bei allen Gruppen ähnlich verlaufen. Durchschnittlich lag der erste Eindruck 
der befragten Studierenden (N = 871) von der jeweiligen dozierenden Person 
6.37 Monate (SD = 10.60) zurück, also zumeist zeitlich nah an der Erhe- 
bung. Zusammenfassend kann also angenommen werden, dass es sich bei der 
hier vorliegenden retrospektiven Erfassung der Lernendenkompetenzerwartungen 
zumindest um eine Näherung der Erwartungen handelt. 
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Im Anschluss an den ersten Erhebungsteil für die Studierenden führte die leh- 
rende Person in Abwesenheit der Versuchsleitung die Lehrveranstaltungssitzung 
regulär durch. Am Ende der Lehrveranstaltungssitzung sollten die Studierenden 
und Dozierenden die Sitzung und ihr Erleben währenddessen beurteilen. Die 
Versuchsleitung war zumeist der Autor der vorliegenden Arbeit. Aus organisatori- 
schen Gründen (z. B. aufgrund von zwei sich überschneidenden Untersuchungen) 
war dies nicht immer der Fall. Die Auswertung der Daten erfolgte mit IBM SPSS 
25 und MPlus 8. 


16.2.3 Instrumente im Original 


Im Folgenden werden die Variablen, die in der Untersuchung verwendet wurden, 
in der im Fragebogen präsentierten Reihenfolge beschrieben. Die in den Beschrei- 
bungen der Instrumente angegebenen internen Konsistenzen beziehen sich auf die 
zitierten Originalquellen bzw. der Validierungsstudien. Die erzielten Reliabilitä- 
ten (Cronbachs Alpha) in der durchgeführten Studie sind für die Studierenden 
in Tabelle 16.3 und für die Dozierenden in Tabelle 16.7 angegeben. Beispieli- 
tems sind in der Tabelle 16.1 für dir Studierenden und in Tabelle 16.2 für die 
Dozierenden aufgeführt (Fragebögen und Itemanalysen s. Zusatzmaterial). 


16.2.3.1 Studierendenfragebogen zu Beginn der 
Lehrveranstaltungssitzung 

Kompetenzeindruck (erster Eindruck): Die Einschätzung der Kompetenz beim ers- 

ten Eindruck wurde mittels der vier Adjektive der vorherigen Studien (kompetent, 

effizient, fähig, intelligent) auf einer siebenstufigen Likert-Skala (1 = „stimme gar 

nicht zu“ bis 7 = „stimme vollkommen zu“) erfasst. 

Wärmeeindruck (erster Eindruck): Die Einschätzung der Wärme beim ers- 
ten Eindruck wurde mit vier Adjektiven der vorherigen Studien (warmherzig, 
gutmütig, wohlwollend, sympathisch) in der gleichen Liste wie die Kompetenz- 
beurteilung mit einer siebenstufigen Likert-Skala (1 = „stimme gar nicht zu“ bis 
7 = „stimme vollkommen zu‘) erfasst. 

Attraktivitätsbeurteilung: Die Einschätzung der aktuellen physischen Attrak- 
tivität wurde ähnlich wie in der ersten und dritten Studie mit folgendem Item auf 
einer siebenstufigen Likert-Skala (1 = „sehr unattraktiv“ bis 7 = „sehr attraktiv“) 
erhoben: „Wie optisch attraktiv empfinden Sie die Dozierende/den Dozierenden 
der Lehrveranstaltung momentan?“ 


16.2 Methodik 129 


Tabelle 16.1 Verwendete Instrumente und Skalen mit Beispielitems für die Studierenden- 
Fragebögen zur Bewertung der Veranstaltungssitzung (Studie 4) 


Verwendete Instrumente Original 


Skala (Itemanzahl) Beispielitem Beispielitem im Original? (Itemanzahl) 


Studierendenfragebogen 
Kompetenz- und Wärmebeurteilung nach Studien 1-3 


Kompetenz (4) Kompetent Kompetent (4) 
Wärme (4) Sympathisch Sympathisch (4) 


Motivationales und emotionales Erleben nach Wegner et al. (2013) 


Freude (4) Die Seminarsitzung hat mich Der Biologieunterricht der letzten 

sehr begeistert. Stunden hat mich sehr begeistert. (4) 
Frustration (4, ein Ich wusste in der Seminarsitzung Ich wusste in den letzten 
Item zu „Langeweile“) nicht, was Sache ist. Biologiestunden nicht, was Sache ist. (5) 
Langeweile (5, ein Ich habe bemerkt, dass ich in der Ich habe bemerkt, dass ich in den letzten 
Item aus Seminarsitzung oft geistig Biologiestunden oft geistig abwesend 
„Frustration‘“) abwesend war. war. (4) 
Interesse (4) Das Thema der Seminarsitzung _Interessiertheit: Die letzten 

hat mich richtig interessiert. Biologiestunden haben mich richtig 


interessiert. (4) 


Störungswahrnehmung und Klassenführung nach Wettstein, Ramseier et al. (2016), ergänzt um 
Störungen in Anlehnung an Keller (2010) 


Störungen (5, 2 Items Einige Studierende schwatzten Nicht aggressives Verhalten: Einige 
zu ,,Teilabsentismus“) mit anderen Studierenden Kinder schwatzen, während diese 
außerhalb von Gruppenarbeiten. Lehrperson etwas erklärt. (4, inkl. 
Ergänzungen 14) 


Störungsmissmanage- Die/der Dozierende musste oft Störungen des methodisch-didaktischen 

ment eingreifen, um Aufmerksamkeit Settings: Diese Lehrperson muss oft 

(4) zu bekommen. eingreifen, um Aufmerksamkeit zu 

bekommen. (4) 

Beziehung (2) Ich mochte die Dozierende/den Ich mag diese Lehrperson. (6) 
Dozierenden. 

Klassenführung (0) Die/der Dozierende hatte Diese Lehrperson hatte Überblick über 
Überblick über das, was im das, was in der Klasse geschieht. (3) 


Seminar geschah. 


Teilabsentismus (in Anlehnung an Keller, 2010) 


Teilabsentismus (2, Einige Studierende kamen zu 
aus „Störungen“) spät. 


Anmerkungen. * Bei abweichendem Skalennamen zum Original wurde dieser vor dem Beispielitem, 
getrennt durch einen Doppelpunkt, benannt. 
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Tabelle 16.2 Verwendete Instrumente und Skalen mit Beispielitems für die Dozierenden- 
Fragebögen zur Bewertung der Veranstaltungssitzung (Studie 4) 


Verwendete Instrumente Original 


Skala (Itemanzahl) Beispielitem Beispielitem im Original? (Itemanzahl) 


Dozierendenfragebogen 


Affekt nach Rahm et al. (2017) 


Positiver Emotionen Angenehm Angenehm (6) 
(6) 

Negativer Emotionen Unangenehm Unangenehm (6) 
(6) 

Kompetenz- und Wärmewahrbeurteilung nach Studien 1-3 

Kompetenz DLV (4) Kompetent Kompetent (4) 
Wärme DLV (4) Sympathisch Sympathisch (4) 


Flowerleben nach Rheinberg et al. (2003) 


Flowerleben (10) Ich fühlte mich optimal Ich fühlte mich optimal beansprucht. (10) 
beansprucht. 


Störungswahrnehmung und Klassenführung nach Wettstein, Ramseier et al. (2016), ergänzt um 
Störungen in Anlehnung an Keller (2010) 


Störungen (5, 2 Items Einige Studierende Nicht aggressives Verhalten: Einige Kinder 

zu ,,Teilabsentismus“) schwatzten mit anderen schwatzen, während diese Lehrperson etwas 
Studierenden außerhalb von erklärt. (4, inkl. Ergänzungen 14) 
Gruppenarbeiten. 

Störungsmissmanage- Ich muss oft eingreifen, um Störungen des methodisch-didaktischen 

ment Aufmerksamkeit zu Settings: Ich musste oft eingreifen, um 

(4) bekommen. Aufmerksamkeit zu bekommen. (4) 

Beziehung (2) Ich mag die Studierenden Ich mag meine Klasse. (6) 


des Seminars. 


Klassenführung (0) Ich hatte den Überblick über Diese Lehrperson hatte Überblick über das, 
das, was im Seminar was in der Klasse geschieht. (3) 
geschah. 


Teilabsentismus (in Anlehnung an Keller, 2010) 


Teilabsentismus (2, aus Einige Studierende kamen 
„Störungen“) zu spät. 


Anmerkungen. * Bei abweichendem Skalennamen zum Original wurde dieser vor dem Beispielitem, 
getrennt durch einen Doppelpunkt, benannt. 
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16.2.3.2 Studierendenfragebogen zum Ende der 
Lehrveranstaltungssitzung 

Kompetenzbeurteilung in Lehrveranstaltungssitzung: Die Einschätzung der Kom- 

petenz innerhalb der Lehrveranstaltungssitzung wurde mittels der vier Adjektive 

der vorherigen Studien (kompetent, effizient, fähig, intelligent) auf einer sieben- 

stufigen Likert-Skala (1 = „stimme gar nicht zu“ bis 7 = „stimme vollkommen 

zu‘) erfasst. 

Wärmebeurteilung in Lehrveranstaltungssitzung: Die Einschätzung der Wärme 
innerhalb der Lehrveranstaltungssitzung wurde mit vier Adjektiven der vorhe- 
rigen Studien (warmherzig, gutmütig, wohlwollend, sympathisch) in der glei- 
chen Liste wie die Kompetenzbeurteilung mit einer siebenstufigen Likert-Skala 
(1 = „stimme gar nicht zu“ bis 7 = „stimme vollkommen zu“) erfasst. 

Motivationales und emotionales Erleben: Das motivationale und emotionale 
Erleben der Studierenden während der Lehrveranstaltungssitzung wurde mit 
einem für die Hochschule adaptierten Fragebogen von Wegner (2009, nach 
Wegner et al., 2013) erfasst. Der ursprüngliche Fragebogen fokussierte den Bio- 
logieunterricht in der Schule und besteht aus vier Subskalen: Freude (4 Items, 
a > .92), Frustration (5 Items, а > .75), Langeweile (4 Items, a > .76) und 
Interessiertheit (4 Items, а > .83). Freude ist dabei bestimmt als das Ausmaß 
des Erlebens von Spaß, Begeisterung und Freude. Frustriert sein und das Erleben 
von Unsicherheit gehen in die Skala Frustration ein. Langeweile ist bestimmt als 
das Gefühl, dass die Zeit nicht vergeht, sowie, keine (sinnvolle) Beschäftigung zu 
haben, und die Skala Interessiertheit beinhaltet Interesse und Neugier in Bezug 
auf das Lehrthema. Die Proband*innen sollten auf einer vierstufigen Likert-Skala 
ihre Zustimmung angeben (1 = „stimmt gar nicht“ bis 4 = „stimmt genau‘). 

Störungswahrnehmung und Klassenführung: Die Störungs- und Klassenfüh- 
rungswahrnehmung wurde auf Basis des Fragebogens zur Wahrnehmung von 
Unterrichtsstörungen aus Lehrkräfte- und Schiiler*innenperspektive von Wett- 
stein, Ramseier et al. (2016; vgl. Wettstein, Scherzinger & Wyler, 2016) 
konstruiert. Der Fragebogen wurde gewählt, da er sowohl eine Schüler*innen- 
als auch eine Lehrkräfte-Version bereithält. Es wurden die Subskalen „Nicht 
aggressives Verhalten der Schülerinnen und Schüler“ (Schüler*innen: a = .88, 
Lehrkräfte: а = .72) mit einer vierstufigen Likert-Skala zur Einschätzung der 
Häufigkeit (1 = „nie“ bis 4 „sehr oft“), „Störungen des methodisch-didaktischen 
Settings“ (Schüler*innen: а = .87, Lehrkräfte: а = .82), „Beziehung“ (Schü- 
ler*innen: а = .95, Lehrkräfte: а = .55) und „Klassenführung“ (Schüler*innen: 
a = .82, Lehrkräfte: а = .58) mit einer vierstufigen Likert-Skala zur Zustim- 
mung (1 = „stimmt nicht“ bis 4 = „stimmt‘“) herangezogen. Die Items wurden so 
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ausgewählt, dass sie sowohl für den schulischen als auch für den Hochschulkon- 
text augenscheinlich sinnvoll sind. Die Items wurden für den Hochschulkontext 
umformuliert sowie um ausgewähltes, nicht aggressives Störungsverhalten, das in 
Keller (2010) formuliert ist, ergänzt. Außerdem wurde die Option „nicht sinnvoll 
beantwortbar“ hinzugefügt. 

Soziodemografische und weitere Variablen: Es wurden das Geschlecht erfragt, 
das Alter, das Fachsemester!, die Fakultat(en) des Studiengangs, die Häufig- 
keit des Besuchs einer Lehrveranstaltung vor dem Sommersemester 20187 bei 
der entsprechenden dozierenden Person, die Zeit, wie lang der erste Eindruck 
zurückliegt, und wie häufig bereits an der Studie teilgenommen wurde. 


16.2.3.3 Dozierendenfragebogen (zum Ende der 
Lehrveranstaltungssitzung) 

Positive und negative Emotionen: Das Erleben von positiven und negativen Emo- 
tionen wurde mit der deutschen Version der scale of positive and negative 
experience (SPANE) von Rahm et al. (2017) erhoben. Beim SPANE werden 
abwechselnd positive (z. B. „ош“; а = .87) und negative Beschreibungen (z. В. 
„unangenehm“; а = .82) präsentiert. Da nur das Erleben innerhalb der Lehrveran- 
staltungssitzung erfasst werden sollte, wurde die Intensität mit einer fünfstufigen 
Likert-Skala (1 = „gar nicht“ bis 5 = „außerordentlich‘“) — analog zu Friedrich 
(2017) — erhoben. 

Beurteilung der eigenen Kompetenz in der Lehrveranstaltungssitzung: Die 
Selbsteinschätzung der Kompetenz innerhalb der Lehrveranstaltungssitzung 
wurde mittels der vier Adjektive der vorherigen Studien (kompetent, effizient, 
fähig, intelligent) auf einer siebenstufigen Likert-Skala (1 = „stimme gar nicht 
zu“ bis 7 = „stimme vollkommen zu“) erfasst. Die Instruktion wurde für eine 
Selbsteinschätzung angepasst. 

Beurteilung der eigenen Wärme in der Lehrveranstaltungssitzung: Die Selbst- 
einschätzung der Wärme innerhalb der Lehrveranstaltungssitzung wurde mit 
vier Adjektiven der vorherigen Studien (warmherzig, gutmütig, wohlwollend, 
sympathisch) in der gleichen Liste wie die Kompetenzbeurteilung mit einer 
siebenstufigen Likert-Skala (1 = „stimme gar nicht zu“ bis 7 = „stimme 


! Da einige Studierende ausschließlich das Fachsemester des Masterstudiums und andere 
das Fachsemester des Masterstudiums addiert um die Fachsemester des Bachelorstudiums 
berichteten und somit die Angaben nicht vergleichbar sind, wurde diese Variable für die 
Beschreibung der Stichprobe nicht berücksichtigt. 

2 Da die Frage nicht für den Durchgang im Wintersemester 2018/19 angepasst wurde, wurde 
sie in den Analysen nicht berücksichtigt. 
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vollkommen zu“) erfasst. Die Instruktion wurde für eine Selbsteinschätzung 
angepasst. 

Flowerleben: Das Flowerleben wurde mit der 10-Items-Flow-Kurzskala 
(FKS) von Rheinberg et al. (2003, 2019) erhoben. Die Skala besteht aus 
den Subskalen „glatter automatischer Verlauf“ (а = .92) und „Absorbiert- 
heit“ (a = .80), die beide eine siebenstufige Zustimmungs-Likert-Skala nutzen 
(1 = „trifft nicht zu“ bis 7 = „trifft zu“). Rheinberg et al. (2003) argumentieren 
auch für einen Generalfaktor (а = .90), der in den Analysen dieser Arbeit genutzt 
wurde. 

Störungswahrnehmung und Klassenführung: Die Störungswahrnehmung und 
die Wahrnehmung der eigenen Klassenführung wurde mit einer für Dozierende 
parallel gestalteten Version der Studierendenfragebögen in Anlehnung an Wett- 
stein, Ramseier et al. (2016; vgl. Wettstein, Scherzinger & Wyler, 2016) erfasst 
(8. 0.). 

Soziodemografische und weitere Variablen: Es wurden das Geschlecht, das 
Alter, die Lehrerfahrung in Semestern, die zugeordnete Fakultät der Lehr- 
veranstaltung und die Anzahl der bisherigen Sitzungen der Lehrveranstaltung 
erhoben. 


16.2.3.4 Faktorenanalysen und finale Instrumente 
Da alle Instrumente für die Studierenden ursprünglich für den schulischen Kon- 
text konstruiert wurden’, wurden die Items und Skalen anhand der studentischen 
Stichprobe überprüft. Die Basis für die Item- und Faktorenanalysen bildeten die 
eindeutigen Erstteilnahmen (N = 663), wobei die finale Faktorenstruktur für alle 
studentischen Angaben (inkl. Mehrfachteilnahmen; N = 871) überprüft wurde. 
Zuerst wurden die Items auf Basis der Schwierigkeiten (5 < P; < 95; 
vgl. Kelava & Moosbrugger, 2020)* ausgewählt. Items, bei denen die Option 
„Nicht sinnvoll beantwortbar“ mit mindestens einem Viertel (25 %) der Antwor- 
ten entsprach, wurden weitergehend aus den weiteren Analysen ausgeschlossen; 
diese scheinen nicht relevant für die Hochschule zu sein. Da die Anga- 
ben der Studierenden innerhalb von Gruppen strukturiert sind, sollten dann 
Mehrebenen-Faktorenanalysen berechnet werden (.054 < ICC < .423, M = .194, 
SD = .074; s. Zusatzmaterial). Bei Mehrebenen-Faktorenanalysen wird die 


3 Die Auswahl von Items, die fiir den schulischen Kontext gedacht sind, sollte einen Ver- 
gleich zwischen Schule und Hochschule ermöglichen. 

4Da bei den freiwillig teilnehmenden Dozierenden ein Selektionseffekt vorliegen kann, 
sodass insbesondere die kompetenten und selbstbewussten Dozierenden sich bereit erklärten 
(s. a. Tollefson & Wigington, 1986), wurde sich für eine weite Spannweite der Itemschwie- 
rigkeit entschieden. 
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Gesamtvarianz von Beobachtungen zerlegt in die Varianz innerhalb (Individual- 
ebene; within) und zwischen Gruppen (bzw. Kontexteinheiten; Gruppenebene; 
between), wobei unterschiedliche Faktorenstrukturen zwischen Gruppen- und 
Individualebene? entstehen können (Kleinke et al., 2017). Simulationsstudien 
zeigten jedoch, dass 50 Level-2-Einheiten (hier: 42 Lehrveranstaltungsgruppen) 
für den vorliegenden Datensatz (z. B. häufig keine Normalverteilungen) zu gering 
sind (Holtmann et al., 2016; Hox & Maas, 2001; Hox et al., 2010). Des- 
wegen wurden die Faktorenanalysen ohne Beriicksichtigung der hierarchischen 
Datenstruktur durchgefiihrt. 

Fiir die Faktorenanalysen wurde ein robustes Weighted-Least-Squares- 
Verfahren (WLSMV) genutzt, das robust gegen Verletzungen der Normalver- 
teilung und auch fiir ordinale Daten angemessen ist (Holtmann et al., 2016; 
Li, 2016). Auch die Nutzung der teilweise wenigen Abstufungen der Likert- 
Skalen (Biihner, 2010) war ein Grund fiir das Verfahren fiir ordinale Daten. 
Darüber hinaus ist das WLSMV-Verfahren gut fiir kleine Stichprobengrößen 
geeignet (Eid et al., 2017). Um die besondere Datenstruktur zu berücksichtigen, 
wurde außerdem „COMPLEX“ als Analysetyp in MPlus herangezogen. „COM- 
PLEX computes standard errors and a chi-square test of model fit taking into 
account stratification, non-independence of observations, and/or unequal probabi- 
lity of selection“ (Muthén & Muthen, 2017, S. 659). Insgesamt wurden also sehr 
robuste Verfahren für die Bestimmung der Faktorenstruktur herangezogen. Zwei 
Faktorenanalysen wurden berechnet: eine für den ersten Eindruck (Fragebogen 
am Anfang der Veranstaltungssitzung) und eine zweite für die Beurteilung der 
Veranstaltungssitzung (Fragebogen am Ende der Veranstaltungssitzung). 

Die konfirmatorische Faktorenanalyse zum ersten Eindruck bestätigte die 
zweifaktorielle Lösung mit der Wärme- und Kompetenzbeurteilung über die 
Angaben der Erstteilnahmen (N = 663; y7/df = 2.794; CFI = .998; 
TLI = .997; RMSEA = .052; WRMR = 0.560). Uber alle Angaben (N = 871) 
ergaben sich auch gute Fitmaße (x7/df = 3.739; CFI = .997; TLI = .996; 
RMSEA =.056; WRMR = 0.644), wenngleich das Verhältnis von x? zu den 
Freiheitsgraden über dem empfohlenen Cutoff-Wert von 3 liegt (vgl. Weiber & 
Mühlhaus, 2014). 

Für die Maße spezifisch für die Veranstaltungssitzung wurde ein gemein- 
sames Modell herangezogen. Dies erzielte gute Fitmaße (x”/df = 1.398; 


5 Im Folgenden werden die Begriffe „Individualebene“ und „Gruppenebene“ für hierarchi- 
sche Analysen genutzt. Für Analysen ohne Berücksichtigung der hierarchischen Datenstruk- 
tur werden die Begriffe „individuelle Ebene“ und „aggregierte Gruppenwerte“ genutzt. 
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CFI = .981; TLI = .979; RMSEA = .024), jedoch lag der WRMR mit 
1.015 zu hoch (vgl. Cook et al., 2009; Yu, 2002). Auf Basis verschiedener explo- 
rativer Faktorenanalysen (WLSMV und COMPLEX) der einzelnen Fragebögen 
wurden folgende Änderungen im Gesamtmodell vorgenommen: Das Item „In der 
Seminarsitzung war ich eifrig bei der Sache“ wurde dem Faktor „Langeweile“ 
zugeordnet (ursprünglich ,,Frustration“). Die Items „Einige Studierende kamen zu 
spät“ und „Einige Studierende gingen zu früh“ wurden zu einem separaten Faktor 
„Teilabsentismus“ (vorher im Faktor „Störungen“). Die Items zur Klassenführung 
wurden aufgrund uneinheitlicher Faktorladungen entfernt („Die/der Dozierende 
hatte den Überblick über das, was im Seminar geschah“, „Die/der Dozierende 
merkte, wenn Studierende nicht bei der Sache waren“). Die finale Lösung 
mit folgenden Faktoren erzielte gute bis sehr gute Fitmaße (x7/df = 1.386; 
CFI = .984; TLI = .982; RMSEA = .024; WRMR = 0.942; mit Attraktivi- 
tätsbeurteilung als einzelnes Item: xldf = 1.348; CFI = .984; TLI = .982; 
RMSEA = .023; WRMR = 0.890): Kompetenzbeurteilung für die Lehrveran- 
staltungssitzung, Wärmebeurteilung für die Lehrveranstaltungssitzung, Freude, 
Frustration, Langeweile, Interesse (Bezeichnung im Original: „Interessiertheit‘), 
Störungen (Bezeichnung im Original: „Nicht aggressives Verhalten der Schü- 
lerinnen und Schüler“), Teilabsentismus, Störungsmissmanagement (Bezeich- 
nung im Original: „Störungen des methodisch-didaktischen Settings“) und 
Beziehung (sowie Attraktivitätsbeurteilung; Beispielitems der Skalen s. Tabelle 
16.1; alle Items s. Zusatzmaterial). Eine anschließende konfirmatorische 
Faktorenanalyse über alle Angaben (N = 871) bestätigte die faktorielle 
Validität (x?/df = 1.439; CFI = .983; TLI = .981; RMSEA = .022; 
WRMR = 0.974; mit Attraktivitätsbeurteilung als einzelnes Item: xldf = 1.397; 
CFI = .984; TLI = .981; RMSEA = .021; WRMR = 0.921). 


16.3 Ergebnisse 


16.3.1 Studierende 


Die zentralen Kennwerte der Skalen können der Tabelle 16.3 entnommen wer- 
den und die (Rang-)Korrelationen der Tabelle 16.4 (Pearson-Korrelationen auf 
individueller Ebene s. Zusatzmaterial). Die Ergebnisse der Studierenden wur- 
den sowohl auf Individual- als auch auf Gruppenebene betrachtet, um die 
Mehrebenen-Struktur der Daten zu berücksichtigen: Zur Überprüfung des Hypo- 
thesenkomplexes 1 wurden hierarchische Regressionsanalysen auf Basis aller 
studentischen Angaben (N = 871) berechnet. 
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Tabelle 16.3 Kennwerte der Studierenden-Variablen (Studie 4) 


N M SD а SW Нетапхаћ! 


Proband*innen 


Geschlecht* 83 1.73 0.44 5** 1 
Alter 838 22.65 4.08 НИК 1 
Erster Eindruck und Attraktivitätsbeurteilung 

Wie lang liegt der erste Eindruck 770 6.37 10.58 .64** 1 
zuriick? (in Monaten) 

Kompetenzeindruck? 865 5.95 1.11 .92 .81** 
Wärmeeindruck® 861 5.66 1.33 .95 .87** 
Attraktivitätsbeurteilung® 847 4.37 1.20 .93** 1 
Beurteilung innerhalb der Lehrveranstaltungssitzung 

Kompetenzbeurteilung іп ІУ? 868 6.15 1.04 .92 .76** 4 
Wärmebeurteilung in LV? 863 5.86 1.26 .96 .83** 4 
Freude“ 866 2.84 0.71 .89 .96** 4 
Frustration® 866 145 0.60 .81 .77** 5 
Langeweile“ 561 166 043 .84 .91** 4 
Interesse“ 864 2.69 0.70 .85 .98** 4 
Störungen“ 521 174 047 ЛО .94** 5 
Teilabsentismus“ 792 167 059 54 .88** 2 
Störungsmissmanagement“ 686 1.31 046 .80 .71** 4 
Beziehung“ 659 351 0.63 .85 .76** 2 


Anmerkungen. Gesamtstichprobe: N = 871; Mehrfachteilnahmen waren möglich. а = Cron- 
bachs Alpha; SW = Shapiro-Wilk-Test auf Normalverteilung; LV = Lehrveranstaltungssit- 
zung. * Codierung: 1 = männlich, 2 = weiblich. 5 Mögliche Werte: 1-7. © Mögliche Werte: 
1—4. * p < .05. ** p < .01. 


In der ersten Regressionsanalyse wurde ausschließlich die Kompetenzbeurtei- 
lung beim ersten Eindruck (Kompetenzeindruck) als Regressor berücksichtigt. 
Die Ergebnisse sind in Tabelle 16.5 zu finden. Die Varianz auf der Indivi- 
dualebene konnte durch den Kompetenzeindruck weniger gut aufgeklärt werden 
(.000 < R? < .527) als die auf Gruppenebene (.052 < R? < .851). Bedeut- 
sam (IBI > .300) hing der Kompetenzeindruck auf Individualebene mit der 
Bewertung der Kompetenz (В = .527, p < .001) und Wärme (В = .321, 
p < .001) der Dozierenden in der Lehrveranstaltungssitzung zusammen. 
Auf der Gruppenebene ergaben sich bedeutsame Zusammenhänge für alle 
Regressanden mit Ausnahme der Wahrnehmung von Teilabsentismus (ß = —.229, 
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р = .116). Mittelgroße bis große Zusammenhänge (IBI > .500) zeigten sich bei 
der Kompetenz- (В = .923, p < .001) und Wärmebeurteilung (B = .543, 
p < .001) der Dozierenden in der Lehrveranstaltungssitzung, der berichteten 
Freude (В = .604, р < .001) und Langeweile (8 = —.689, р < .001), dem 
Interesse am Lehrveranstaltungsthema (ß = .513, p < .001), der wahrgenom- 
menen Beziehung (В = .569, р < .001) sowie der Wahrnehmung von Störungen 
(B = —.771, p < .001) und des Störungsmissmanagements (В = —.855, p < .001). 

In der zweiten Regressionsanalyse gingen die Kompetenz- und Wärmebe- 
urteilung (Kontrollvariable basierend auf dem stereotype content model) des 
ersten Eindrucks (Kompetenz- und Wärmeeindruck) sowie die Attraktivitäts- 
beurteilung (Kontrollvariable aufgrund des „beauty is good“ stereotype) als 
Regressoren ein. Die Ergebnisse der hierarchischen Regressionsanalysen sind 
in Tabelle 16.6 dargestellt. Insgesamt konnten die Regressionsanalysen viel bis 
sehr viel Varianz der Regressanden signifikant auf Gruppenebene aufklären 
(.345 <R< .972); ausgenommen hiervon war der Teilabsentismus (R? = .044, 
p = .443). Auf der Individualebene konnte weniger Varianz aufgeklärt werden 
(.004 < R? <.507). Unter Berücksichtigung der Kontrollvariablen verringerten 
sich die Zusammenhänge des Kompetenzeindrucks mit einigen Regressanden, was 
insbesondere auf die Zusammenhänge mit dem Wärmeeindruck zurückzuführen 
ist. Die Attraktivitätsbeurteilung ist kaum bedeutsam. Auf der Individualebene 
hing der Kompetenzeindruck nur noch bedeutsam (Ißl > .300) mit der Kompe- 
tenzbeurteilung der Dozierenden in der Lehrveranstaltungssitzung zusammen 
(В = .681, p < .001). Während der Kompetenzeindruck in der ersten hierarchischen 
Regressionsanalyse ohne Kontrollvariablen mittelgroße bis große Zusammenhänge 
(IBI > .500) mit acht von zehn Regressanden auf der Gruppenebene hatte, ergaben 
sich in der zweiten Regressionsanalyse mit Kontrollvariablen nur noch mittelgroße 
bis große Zusammenhänge mit vier Regressanden: Kompetenzbeurteilung der 
Dozierenden in der Lehrveranstaltungssitzung (B = .858, p < .001), Langeweile 
(B = —.617, p < .001), Wahrnehmung von Störungen (8 = —.764, p < .001) und 
von Störungsmissmanagement (В = —.797, р < .001). Für die Kompetenzerwartun- 
gen — unter Berücksichtigung der Kontrollvariablen – können die Hypothesen 1, 3, 
4, 5, 6 und 8 des ersten Hypothesenkomplexes auf Gruppenebene bei mindestens 
mittelgroßer Effektstärke (IBI > .300) angenommen werden sowie die Hypothese 6 
für die Individualebene (s. Tabelle 16.6). 
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Der Warmeeindruck hing auf Individualebene (181 > .300) mit der Beurtei- 
lung der Wärme in der Lehrveranstaltungssitzung (ß = .599, p < .001) sowie der 
Beschreibung der Beziehung (В = .302, р < .001) zusammen. Auf Gruppene- 
bene hing der Wärmeeindruck (IBI > .500) hingegen mit der Wärmebeurteilung 
in der Lehrveranstaltungssitzung (ß = .926, p < .001), der Freude (ß = .517, 
p = .001), der Frustration ( = —.545, p < .001) und der Beschreibung der 
Beziehung (ß = .890, p < .001) in der Lehrveranstaltungssitzung zusammen. 


16.3.2 Dozierende 


In Tabelle 16.7 sind die zentralen Kennwerte der Variablen und die Korrela- 
tionen in Tabelle 16.8 gelistet. In Tabelle 16.9 finden sich die Korrelationen 
mit dem mittleren ersten Eindruck der Studierenden (Kompetenz- und Wär- 
meeindruck) sowie deren Attraktivitätsbeurteilung der Dozierenden (aggregierte 
Gruppenwerte). 


Tabelle 16.7 Kennwerte der Dozierenden-Variablen (Studie 4) 


N M SD а SW Itemanzahl 
Geschlecht‘ 40 1.63 0.49 .62** 1 
Alter 38 38.89 11.35 .82** 1 
Lehrerfahrung (in Semestern) 39 16.21 13.73 .79%% 1 
Positive Emotionen 40 3.78 0.60 .83 .94 6 
Negative Emotionen 37 1.27 0.36 81 .79%% 6 
Kompetenz DLV”? 41 5.43 0.90 277 94 4 
Wärme DLV? 40 5.36 0.86 85 94 4 
Flowerleben 40 5.39 0.72 18 92 10 
Störungen 29 1.50 0.36 .65 92 5 
Teilabsentismus 40 1.66 0.54 56 .85* 2 
Störungsmissmanagement 32 1.45 0.48 74 89 4 
Beziehung 33 3.77 0.33 SA 739% 2 


Anmerkungen. а = Cronbachs Alpha; SW: Shapiro-Wilk-Test auf Normalverteilung. 
а Codierung: 1 = männlich, 2 = weiblich. ® Subjektive Beurteilung der Dozierenden von 
sich selbst während der Lehrveranstaltungssitzung. * р < .05. ** p < .01. 
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Tabelle 16.9 Korrelationen des Dozierenden-Erlebens mit dem studentischen ersten Ein- 
druck und der Attraktivitätsbeurteilung (Studie 4) 


Erster Eindruck und Attraktivitätsbeurteilung der 


Studierenden? 
Kompetenz 
rs p Wärme Attraktivität 
Geschlecht’ —.291 .069 —.17 22 
Alter —.040 811 —.06 —.60** 
Lehrerfahrung (in Semestern) .059 .722 —.05 —.49** 
Positive Emotionen 327* .039 .09 24 
Negative Emotionen —.078 .645 .16 —.07 
Kompetenz DLV .318* .043 01 13 
Wärme DLV‘ .205 .203 48** 19 
Flowerleben .220 173 11 17 
Störungen —.084 .666 .07 .05 
Teilabsentismus —.060 714 —.01 —.17 
Störungsmissmanagement —.388* .028 12 22 
Beziehung 223 ‚212 16 09 


Anmerkungen. Korrelationen nach Spearman. 29 < N < 42. * Subjektive mittlere studenti- 
sche Beurteilung der Dozierenden (aggregierte Gruppenwerte). ® Codierung: 1 = männlich, 
2 = weiblich. ° Subjektive Beurteilung der Dozierenden von sich selbst während der Lehr- 
veranstaltungssitzung. * p < .05. ** p < .01. 


Die Hypothesen, inwieweit der erste Eindruck der Kompetenz, den Lernende 
von ihren Dozierenden hatten, mit der Wahrnehmung einer Lehrveranstaltungs- 
sitzung der Dozierenden und der Wahrnehmung von sich selbst zusammenhängt, 
wurden in bivariaten Analysen mit Rangkorrelationen nach Spearman über- 
prüft (s. Tabelle 16.9). Der mittlere erste Kompetenzeindruck hing signifikant 
mit der Einschätzung der eigenen Kompetenz der Dozierenden in der Lehrveran- 
staltungssitzung zusammen (rs = .318, p = .043; 1—-ß = .527), außerdem mit 
dem Erleben positiver Emotionen (rs = .327, р = .039; 1—ß = .551) und von 
Störungsmissmanagement (rs = —.388, p = .028; 1-ß = .713). Weitergehend 
zeigten die Vorzeichen der Korrelationen, dass der erste Kompetenzeindruck der 
Studierenden mit einem positiven Erleben der Dozierenden sowie einer besseren 
Beurteilung einer Lehrveranstaltungssitzung zusammenhing. 
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Das multivariate Zusammenspiel vom ersten Kompetenz- und Warmeeindruck 
(Kontrollvariable basierend auf dem stereotype content model), den Studie- 
rende von den Dozierenden hatten, sowie der Attraktivität (Kontrollvariable 
aufgrund des „beauty is good“ stereotype), die die Studierenden den Dozierenden 
zuschrieben, auf das Erleben der Dozierenden wurde mit Regressionsanaly- 
sen mit Bootstrap überprüft. Die Ergebnisse sind in Tabelle 16.10 dargestellt. 
Insgesamt konnte regressionsanalytisch nur wenig Varianz aufgeklärt werden 
(—.063 < korrigiertes R? < .122). Der mittlere Kompetenzeindruck zeigte sich als 
signifikanter Regressor bei den Dozierenden für das Erleben positiver Emotionen 
(В = .366, рь = .029), der eigenen Kompetenz in der Lehrveranstaltungssitzung 
(В = .375, ры = .023), von Flow (В = .401, ppr = .033) sowie von Störungs- 
missmanagement (В = —.399, рь = .028). Auch wenn die Effektstärke für den 
Zusammenhang des Erlebens von Störungen in der Lehrveranstaltungssitzung 
mit dem mittleren, ersten Kompetenzeindruck der Studierenden verhältnismäßig 
hoch ausfiel, verfehlte es in der Analyse mit Bootstrap das Signifikanzniveau 
(B = —.487, рь = .112). Folglich können die Hypothesen 1, 3, 4 und 7 des 
zweiten Hypothesenkomplexes auf Basis der erzielten Ergebnisse angenommen 
werden. 


16.4 Zusammenfassung, Interpretationen und 
Limitationen 


Die vierte Studie ging der Frage nach, welche Auswirkungen Lernenden- 
kompetenzerwartungen an Lehrpersonen haben. Dafür wurde eine Feldstudie 
im Hochschulkontext (Technische Universität Braunschweig) durchgeführt, die 
sowohl die Effekte auf die Lernenden selbst als auch auf die Lehrpersonen 
betrachtete. 


16.4.1 Effekte auf die Lernenden 


Die Intraklassenkorrelationen weisen darauf hin, dass die Wahrnehmung der 
Studierenden — sowohl der Lehrperson als auch des Unterrichtsgeschehens — wei- 
testgehend geteilt wird (vgl. Geiser, 2010). Somit scheinen Studierende innerhalb 
eines Kurses ähnliche Standards der Bewertung heranzuziehen. Weitergehend 
weist die geteilte Wahrnehmung darauf hin, dass es ein Auftreten der Lehrper- 
sonen gibt, das allgemein als kompetent beurteilt wird. Eine genauere Analyse, 
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welche Eigenschaften bzw. Eigenschaftskombinationen dies sind, müsste künf- 
tig untersucht werden, um handlungspraktische Ableitungen zu treffen. So kann 
eine zugewandte, offene Körpersprache von Lehrpersonen mehr Kompetenz aus- 
strahlen (Barmaki, 2014; Feldman & Prohaska, 1979; Gorham et al., 1997, 1999). 
Auch könnte die Stimmhöhe einen Einfluss haben, die Studien hierzu sind jedoch 
uneindeutig (Ko et al., 2009; Krahé & Papakonstantinou, 2020; Oleszikiewicz 
et al., 2017). Nichtsdestotrotz scheinen die Befunde darauf hinzudeuten, dass 
Kompetenz durch eine tiefe Stimme vermittelt wird sowie Wärme/Sympathie 
durch eine hohe Stimme. Ein Training zur gezielten Stimmmodulation kann des- 
wegen in Lehrberufen sinnvoll sein. Weitergehend können auch die Sprechrate, 
die Nutzung von Füllwörtern und -lauten sowie die Betonung bedeutsam sein, 
um Kompetenz und Wärme zu vermitteln (vgl. Kiese-Himmel, 2016). 

Die Zusammenhänge zwischen dem ersten Eindruck und der Wahrnehmung 
der Lehrveranstaltungssitzung folgten — unter Berücksichtigung von Kontrollva- 
riablen — einem bestimmten Muster: Die motivationalen Variablen (Interesse, 
Langeweile) sowie die Wahrnehmung von Störungen und Störungsmissmana- 
gement standen im Zusammenhang mit dem ersten Kompetenzeindruck. Der 
erste Wärmeeindruck hingegen war ein bedeutsamer Regressand für das emo- 
tionale Erleben (Freude, Frustration) sowie für die Wahrnehmung der Beziehung. 
Die Zusammenhänge zeigten sich fast ausschließlich auf der Gruppenebene. Die 
Attraktivitätsbeurteilung spielte unter Beachtung des Kompetenz- und des Wär- 
meeindrucks keine bedeutsame Rolle. Der hohe Zusammenhang von Kompetenz- 
beurteilung beim ersten Eindruck sowie innerhalb der Lehrveranstaltungssitzung 
(rs = .759, р < .001) kann zu großen Teilen daran liegen, dass die identische 
Adjektivliste genutzt wurde. Gleiches gilt für die Wärmebeurteilung (rs = .815, 
p < .001). Außerdem ist der zeitliche Abstand zwischen erstem Eindruck und 
der betrachteten Lehrveranstaltung im Mittel gering (ca. ein halbes Jahr), sodass 
große Abweichungen überraschend gewesen wären. 

Zusammenfassend zeigten sich Kompetenz und Wärme als distinkte, aber 
jeweils wichtige Dimensionen in der sozialen Wahrnehmung im Lehr-Lern- 
Kontext, wie es im Rahmen des stereotype content model (s. Kapitel 5) postuliert 
wird. Die Erwartungseffekte auf die erwartungshaltende Person müssen also je 
nach Art der Erwartung unterschiedlich betrachtet werden. 


16.4.2 Effekte auf die Lehrpersonen 


Der Einfluss des ersten Lernendenkompetenzeindrucks — als Maß für Lernen- 
denkompetenzerwartungen — auf die Lehrpersonen war vergleichsweise geringer 
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als die Wirkung auf die Lernenden selbst. So hing der mittlere studentische 
Kompetenzeindruck in den multivariaten Regressionsanalysen mit kleinen bis 
mittelgroßen Effekten positiv mit dem Erleben der eigenen Kompetenz in der 
Lehrveranstaltung, dem Erleben positiver Emotionen und von Flow sowie negativ 
mit dem Erleben von eigenem Störungsmissmanagement zusammen. 

Die wenigen und teilweise kleinen Effekte auf das Erleben der Dozierenden 
könnten darin begründet liegen, dass sich innerhalb der zeitlich geringen Interak- 
tion zwischen Lehrpersonen und Lernenden keine systematischen, interaktionalen 
Muster ausgebildet haben (interaktionale Schemata; Thies, 2010) — konträr zu 
Jussim und Harber (2005) sowie Raudenbusch (1984). Es könnte sein, dass am 
Ende des jeweiligen Semesters die Effekte auf die Lehrpersonen größer ausgefal- 
len wären. So variiert die Effektstärke auch bei Rosenthal und Jacobson (1971), 
mit einem Höhepunkt ein Jahr nach der Kompetenzmanipulation. 

Weitergehend kann vermutet werden, dass Lehrpersonen im Verlauf der 
Lehrpraxis Coping-Strategien aufbauen und sich somit weniger bzw. weniger 
schnell durch negatives Verhalten der Lernenden beeinflussen lassen. Ob Coping- 
Strategien bedeutsam sind, müsste in weitergehenden Untersuchungen betrachtet 
werden. Andererseits kann es auch sein, dass Lehrpersonen an einer Hochschule 
mit geringem Ausmaß an Lehrverpflichtungen (und weiteren Aufgaben z. B. in 
der Forschung) als Lehrkräfte an allgemeinbildenden Schulen und dem damit 
einhergehenden Selbstkonzept (geringere Identifikation als Lehrende) weniger 
durch problematische Lehr-Lern-Situationen beeinflusst werden und/oder weniger 
sensibel dafür sind. 

Die erzielten Effektstärken liegen unterhalb derer, die Feldman und Prohaska 
(1979) berichteten (141 bis zu 1.93). Die kleinen Effektstärken des mittleren ers- 
ten Lernendenkompetenzeindrucks von den Lehrpersonen sind hier aber vor dem 
Hintergrund der Feldstudie zu interpretieren. Das eigene Erleben und das der 
Lehrveranstaltungssitzung können von vielen weiteren Einflüssen beeinträchtigt 
sein, z. B. vom Wetter, von der Tageszeit, vom erlebten Stress außerhalb der 
Lehrsituation, die innerhalb einer spezifischen Lehrveranstaltungssitzung stärker 
wirksam sein könnten. Deswegen braucht es größere Stichproben (s. u.) bzw. auch 
längsschnittliche Untersuchungen. Weitergehend kann die Höhe der Effektstärke 
auch davon abhängig sein, ob der Kompetenzeindruck bzw. die -erwartungen von 
den Lernenden in größerem oder kleinerem Ausmaß geteilt wird (vgl. Jamie- 
son et al., 1987). Eine diesbezügliche statistische Prüfung konnte hier aufgrund 
der kleinen Stichprobe (N = 41) nicht sinnvoll durchgeführt werden. Zukünf- 
tige Studien im Feld zu Lernendenkompetenzerwartungen sollten dies in der 
Untersuchungsplanung berücksichtigen und von kleinen Effektstärken ausgehen. 
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16.4.3 Limitationen 


Die bedeutsamste Limitation innerhalb der Untersuchung wurde bereits eingangs 
bei der Beschreibung des Vorgehens beschrieben. Sie besteht darin, dass der 
erste Eindruck der Studierenden von der dozierenden Person retrospektiv erfasst 
wurde. Durch diese Methode kann es sein, dass nicht der tatsächliche erste Ein- 
druck erfasst wurde. Auch wenn die Methode Schwächen aufweist, kann sie 
unter der Annahme, dass der erste Eindruck stabil repräsentiert ist (vgl. Schweer, 
2019), als angemessen bewertet werden, insbesondere im Kontext einer Feldstu- 
die. Weitergehend zeigten die Korrelationen der Skalen Kompetenz und Wärme 
beim ersten Eindruck mit der jeweiligen Beurteilung innerhalb der Lehrveran- 
staltung keine perfekten Zusammenhänge. Dies kann als Indiz dafür gedeutet 
werden, dass die teilnehmenden Studierenden ihren tatsächlichen ersten Eindruck 
angaben. Weitergehend lag die erste Begegnung mit der dozierenden Person, für 
die der erste Eindruck erinnert werden musste, im Mittel nur etwa ein halbes 
Jahr zurück, was als überschaubarer Zeitraum gewertet werden kann. Aufgrund 
dieses „pseudo-längsschnittlichen“ Ansatzes sowie der ausschließlichen Betrach- 
tung von Zusammenhängen lassen sich aber keine Kausalitäten ableiten (vgl. 
Döring & Bortz, 2016). Perspektivisch könnten Untersuchungen in Blocksemina- 
ren, bei externen Lehrbeauftragten sowie in der Erwachsenenbildung durchgeführt 
werden, weil dort kontrollierter der erste Eindruck erfragt werden kann. Im schu- 
lischen Kontext ist dies beispielsweise beim Übergang in weiterführende Schulen 
möglich. 

Wie in den vorherigen Studien wurde auch hier auf eine Gelegenheitsstich- 
probe zurückgegriffen. Weitergehend gab es keine repräsentative Auswahl an 
Lehrveranstaltungen, sodass Veranstaltungen aus den Geistes- und Erziehungs- 
wissenschaften stärker repräsentiert waren. Dies und die freiwillige Teilnahme 
der Dozierenden können eine Erklärung für die Deckeneffekte und die damit 
besonders positive Beurteilung sein. So könnten Dozierende insbesondere in 
den Erziehungswissenschaften besonders sensibel für die Gestaltung von Lehre 
sein und ein entsprechendes Auftreten entwickelt haben (im Sinne von posi- 
tiv zu bewertendem Klassenführungsverhalten). Weitergehend kann angenommen 
werden, dass insbesondere Dozierende, die besonders gute Lehrveranstaltungen 
anbieten (z. B. rückgemeldet über regelmäßige Evaluationen), an der Untersu- 
chung teilnahmen. Dadurch kann die Motivation an der Teilnahme an einer Studie 
zur Klassenführung (Cover-Story) erhöht sein. Dies schränkt allerdings die Gene- 
ralisierbarkeit der Ergebnisse deutlich ein, auch weil davon ausgegangen werden 
muss, dass die tatsächliche Varianz der Variablen in der Untersuchung nicht 
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korrekt repräsentiert ist — was auch zu den kleinen Effekten auf die Lehrper- 
sonen führen könnte. Nichtsdestotrotz kann davon ausgegangen werden, dass die 
Richtung der Zusammenhänge (positiv oder negativ) der Variablen angemessen 
beschrieben wird. 

Eine weitere Problematik besteht in Bezug auf die kleine Zahl der teil- 
nehmenden Dozierenden (N = 41) resp. der untersuchten Lehrveranstaltungen 
(N = 42). Dadurch ergab sich eine reduzierte statistische Power (vgl. Hager, 
2004), insbesondere bei der Betrachtung auf Gruppenebene bzw. der Lehrperso- 
nen. Dies ist forschungsökonomisch begründet, da die Erhebungen sehr aufwen- 
dig waren (zwei Messzeitpunkte innerhalb einer Lehrveranstaltungssitzung), und 
könnte künftig um weitere Veranstaltungen ergänzt werden. 

Eine zusätzliche Limitation ergibt sich durch die verwendeten Fragebögen. 
Viele der verwendeten Items wurden ursprünglich für den Schulkontext erstellt 
und für die Hochschullehre sprachlich angepasst. Auch wenn eine intensive 
Itemanalyse durchgeführt sowie die faktorielle Validität überprüft wurde, hätten 
andere Fragebögen, die spezifisch die Hochschullehre fokussieren bzw. Erwach- 
sene adressieren, Anwendung finden können: z. B. Münsteraner Fragebogen 
zur Evaluation von Seminaren (MFE-Sr) bzw. von Vorlesungen (MFE-Vr) von 
Thielsch & Hirschfeld (2014a, 2014b) oder eine lehrveranstaltungsspezifische 
Version des Fragebogens zur Lern- und Leistungsmotivation im Studium (LLMS) 
von Sudman et al. (2014). 

Demgegenüber wurden unterschiedliche Formate von Lehrveranstaltungen 
betrachtet, von kleinen Seminaren (mit n = 7 Teilnehmenden) bis zu größeren 
Vorlesungen (mit n = 78 Teilnehmenden). Außerdem wurden unterschiedli- 
che Fachdisziplinen betrachtet. Auch wenn Lehrveranstaltungen der Geistes- 
und Erziehungswissenschaften am häufigsten vertreten waren, sind sie dennoch 
sehr heterogen. Nichtsdestotrotz sollten in weiteren Untersuchungen auch stärker 
andere Fachdisziplinen, z. B. die Natur- und Ingenieurswissenschaften, fokussiert 
werden. 

Positiv an der Untersuchung hervorzuheben ist die Anzahl der teilnehmenden 
Studierenden (N = 663 Erstteilnahmen). Dadurch ergab sich für die Berechnun- 
gen der Zusammenhänge auf der Lernendenseite eine hohe statistische Power. 
Insgesamt kann diese Feldstudie weitere Erkenntnisse zur Wirkung von Lernen- 
denerwartungen auf Lernende liefern sowie die rare Befundlage zur Wirkung 
derselben auf Lehrpersonen erweitern. 
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Zusammenfassende Diskussion der 1 7 
Ergebnisse 


Ausgehend vom transaktionalen Modell der Lehr-Lern-Interaktion von Nickel 
(1985), wurde der in der (Pädagogischen) Psychologie weitestgehend vernachläs- 
sigten Frage nachgegangen, wie Lernendenkompetenzerwartungen an Lehrperso- 
nen wirken. Lehrendenerwartungen zeigen sich als ein interaktionaler Baustein, 
der das Angebot der Lehrpersonen an Lernende beeinflusst (Angebots-Nutzungs- 
Modell; u. a. Helmke, 2017; Reusser & Pauli, 2010). Besonders wenig ist über die 
Wirkung der Lernendenkompetenzerwartungen, insbesondere auf Lehrpersonen, 
bekannt. In anderen Worten: Es gibt kaum empirische Evidenz, die auf selbs- 
terfüllende bzw. -erhaltende Prophezeiungen von Lernendenerwartungen in der 
Lehr-Lern-Interaktion hinweist. In Anlehnung an das Modell von Nickel (1985) 
wurden deswegen folgende drei Fragen fokussiert: 


1. Wie stark werden Lernendenkompetenzerwartungen an Lehrpersonen durch 
(Geschlechts-)Stereotype bestimmt? 

2. Wie wird das nonverbale Verhalten von Lernenden in Abhängigkeit von den 
Lernendenkompetenzerwartungen an Lehrpersonen beeinflusst? 

3. Wie wirken initiale Lernendenkompetenzerwartungen an Lehrpersonen auf die 
Wahrnehmung der Lehr-Lern-Situation — sowohl bei Lernenden als auch bei 
Lehrpersonen? 


Die erzielten Befunde der vier durchgeführten Studien sind in Abbildung 17.1 
kurz und überblicksartig festgehalten. 
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Studie 4 (b; N = 871): 


Studie 4 (с; № = 41): Lernendenkompetenzerwartungen 
stehen im positiven Zusammen- 
hang mit der Wahrnehmung der 
Kompetenz der Lehrpersonen in 
der Lehre und im negativen mit 

dem Störungsmissmanagements. 


Lernendenkompetenzerwartungen ste- 
hen positiv im Zusammenhang mit dem 
Erleben positiver Emotionen und der ei- 
genen Kompetenz und negativ mit dem 
Störungsmissmanagement aufseiten 
der Lehrpersonen. 


Abbildung 17.1 Überblick über die erzielten Ergebnisse mit Bezug auf die Lernenden- 
kompetenzerwartungen 


Hinweise auf Geschlechts-Professions-Assoziationen (Guimond & Roussel, 
2001; Miller et al., 2018; Nosek et al. 2009; Plante et al., 2009; Smyth & Nosek, 
2015; Su et al., 2009) zeigten sich bisher für Lehrkräfte im Unterrichtsfachver- 
gleich Deutsch und Physik (Degner et al., 2019; Zander et al., 2015). Die Studien 
1 und 2 fokussierten solche Geschlechts-Professions-Assoziationen, abweichend 
zu Degner et al. (2019) und Zander et al. (2015) wurden die Unterrichtsfächer 
Deutsch und Mathematik herangezogen. Beide Studien nutzten Fallvignetten, in 
denen eine Lehrperson beschrieben wurde. Die Hypothesen, dass weibliche Lehr- 
kräfte im Deutschunterricht kompetenter und im Mathematikunterricht weniger 
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kompetent beurteilt werden als männliche, fanden auf Basis der erzielten Ergeb- 
nisse unter Berücksichtigung von Kontrollvariablen weder in Studie 1 noch in 
Studie 2 Unterstützung. Weitergehend konnte Studie 2 auch nicht aufzeigen, 
dass weibliche Lehrkräfte in der Grundschule, in der Erziehung ein wesentli- 
cher Aspekt der Tätigkeit ist (relativ zum Gymnasium), als kompetenter beurteilt 
werden als männliche Lehrkräfte in der Grundschule oder weibliche im Gymna- 
sium. Weibliche Lehrkräfte wurden in Studie 1 — unter Kontrolle von Wärme- 
(stereotype content model; s. Kapitel 5) und Attraktivitätsbeurteilung (,, beauty 
is good“ stereotype; Dion et al., 1972; Eagly et al., 1991; Langlois et al., 
2000) – unabhängig vom Fach kompetenter beurteilt. Der Effekt war jedoch klein 
(Cohen, 1988). Auch in Studie 2 konnte ein kleiner Effekt dafür ausgemacht 
werden, dass weibliche Lehrkräfte kompetenter beurteilt werden als männliche. 
Dieser Effekt verschwindet jedoch unter Berücksichtigung der Wärmebeurteilung. 
Somit müssen die Hypothesen zu den Geschlechts-Professions-Assoziationen ver- 
worfen werden. Dies kann an den ausgewählten Unterrichtsfächern liegen: Es 
kann vermutet werden, dass Physik (im Vergleich zu Mathematik) als besonders 
männliche Domäne wahrgenommen wird, Deutsch jedoch nicht als besonders 
weibliche. Es ist außerdem denkbar, dass männliche Lehrkräfte als Substereotyp 
(vgl. Machunsky, 2020) repräsentiert sind, also nicht dem Stereotyp eines (,,typi- 
schen“ bzw. „durchschnittlichen‘“) Mannes entsprechen, weil sie einen weiblich 
assoziierten Beruf ergriffen haben und somit allgemein wärmer und weniger kom- 
petent beschrieben werden. Welche (Unterrichts-)Fächer mit welchem Geschlecht 
assoziiert sind, sollte in Folgestudien spezifisch für den schulischen bzw. den 
jeweiligen Kontext untersucht werden, sowohl mit expliziten — wie in Studie 1 
und 2 sowie bei Zander et al. (2015) – als auch mit (eher) impliziten Maßen — wie 
der reverse correlation classification task bei Degner et al. (2019) oder mit Impli- 
ziten Assoziationstests (vgl. Eckes, 2020). Insgesamt spiegeln die Ergebnisse der 
Studien 1 und 2 die bisherigen unsystematischen Befunde wider (s. Kapitel 11). 

Die zweite Fragestellung zielte auf das nonverbale Verhalten. Es wurde davon 
ausgegangen, dass sich die Kompetenzerwartungen im nonverbalen Verhalten 
widerspiegeln. Deswegen sollten sich Lernende mit unterschiedlichen Kompeten- 
zerwartungen an Lehrpersonen auch unterschiedlich verhalten. Einige bisherige 
Studien zeigten, dass Lernende, die eine kompetente Lehrkraft erwarteten, sich 
zugewandter und weniger störend verhielten (Feldman & Prohaska, 1979; Jamie- 
son et al., 1987) sowie höhere Leistungen erzielten (Adediwura & Tayo, 2007; 
Edwards et al., 2009; Feldman & Prohaska, 1979; Jamieson et al., 1987). Diese 
Annahme kann auf Basis der Ergebnisse der Studie 3 verworfen werden. Nichts- 
destotrotz zeigten sich kleine bis mittelgroße Effekte für den Blickkontakt sowie 
für das Abstützen des Kopfes: Proband*innen in der Galatea-Bedingung, also 
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bei der Erwartung einer kompetenten Lehrperson, hielten weniger Blickkontakt 
und sahen häufiger weg als Proband*innen in der Golem-Bedingung. Außerdem 
zeigte sich ein statistischer Trend dafür, dass Proband*innen in der Galatea- 
Bedingung weniger lang ihren Kopf abstützten. Somit verhielten sie sich weniger 
zugewandt, was im Widerspruch zu bisherigen Studienbefunden steht. Der Stimu- 
lus, der in der dritten Studie Anwendung fand, war ein relativ monotoner Vortrag. 
Bei Feldman und Prohaska (1979) gab es dyadische Interaktionen, bei Jamieson 
et al. (1987) ein „natürliches“ Lehr-Lern-Setting im Feld. Somit kann argu- 
mentiert werden, dass Lernende sich nicht per se zugewandter verhalten, wenn 
sie eine kompetente Lehrperson erwarten, sondern mehr „Haltung bewahren“ 
(im Sinne von mehr Körperspannung). Bei wenig motivierenden und stimulie- 
renden Reizen vonseiten der Lehrperson versuchen Lernende möglicherweise, 
sich Stimulation außerhalb des Lehr-Lern-Settings zu holen, sodass sie häufi- 
ger weggucken. Demgegenüber verlieren Lernende, die eine weniger kompetente 
Lehrperson erwarten, die Körperspannung: Sie stützen sich ab, z. B. ihren Kopf 
auf den Armen, was ihnen einen längeren Blickkontakt ermöglicht. Dies ist ein 
Verhalten, das bei Mehrabian (1969) als Entspanntheit (relaxation) beschrieben 
wird und mit Status und Macht assoziiert ist. Es kann also vermutet werden, 
dass geringe Kompetenzerwartungen über die Entspanntheit weniger Respekt vor 
der Lehrperson vermitteln. Somit müssen sowohl die Zugewandtheit (immediacy) 
und die Entspanntheit (relaxation) gemeinsam berücksichtigt werden und sind 
je unterschiedlich für verschiedene Lehr-Lern-Settings bedeutsam. Die erziel- 
ten Ergebnisse sprechen für zwei „Langeweileprofile“, die mit Entspanntheit in 
Beziehung stehen. Diese Interpretation bedarf jedoch künftiger Forschung. 

Die finale dritte Fragestellung, wie initiale Lernendenkompetenzerwartungen 
an Lehrpersonen auf die Wahrnehmung von Lehre wirken, wurde in der Stu- 
die 4 in einer Feldstudie untersucht. Dabei ist die Wirkung auf die Lernenden 
selbst von der Wirkung auf die Lehrperson zu unterscheiden. Die (retrospek- 
tiv erfassten) Lernendenkompetenzerwartungen (erster Eindruck) gingen auf 
Lernendenseite mit Motivation sowie mit der Störungswahrnehmung und der 
Wahrnehmung von Störungsmissmanagement einher, wenn für die Attraktivitäts- 
beurteilung und die (retrospektiv erfassten) Wärmeerwartungen (erster Eindruck) 
kontrolliert wird: Je höher die Lernendenkompetenzerwartungen waren, desto 
mehr Interesse und weniger Langeweile wurden berichtet, auch wurden weni- 
ger Störungen sowie ein besseres Störungsmanagement wahrgenommen. Die 
Wärmeerwartung war demgegenüber insbesondere im Zusammenhang mit den 
sozioemotionalen Variablen (Freude, Frustration und Beziehungswahrnehmung) 
innerhalb einer Lehrveranstaltung. Dieses Muster zeigt die Bedeutsamkeit von 
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Erwartungen an unterschiedliche Bereiche resp. psychologische Wahrnehmungs- 
dimensionen. Die Effekte von Kompetenzerwartungen sind nicht mit denen von 
Warmeerwartungen vergleichbar. Die hier durchgefiihrte Differenzierung basiert 
auf dem stereotype content model (u. a. Fiske et al., 1999; s. Kapitel 5), alternative 
Unterscheidungen sind jedoch möglich (z. B. Koch et al., 2016). Nichtsdestotrotz 
ergänzen diese Ergebnisse bisherige Befunde, die ausschließlich die Lernenden- 
kompetenzerwartungen berücksichtigen (Feldman & Prohaska, 1979; Feldman & 
Theiss, 1982; bei Jamieson et al., 1987, wird auch die Motivierungsfähigkeit 
unter Kompetenz subsumiert). Zu beachten ist, dass sich die Zusammenhänge 
der vierten Studie in den Mehrebenenanalysen fast ausschließlich auf der Grup- 
penebene (between) zeigten, die Individualebene (within) kann jedoch nur wenig 
Varianz aufklären. In der Forschung und auch in der Theorie zu (Kompetenz-) 
Erwartungen werden gruppendynamische Prozesse bei selbsterfüllenden Prophe- 
zeiungen nicht berücksichtigt. Die Befunde aus Studie 4 zeigen den Bedarf, 
solche Prozesse systematisch zu betrachten. 

Die Wirkung der Lernendenkompetenzerwartungen auf die Lehrpersonen war 
im Vergleich zur Wirkung auf die Lernenden gering und zeigte keine eindeutige 
Systematik. Der Befund von Feldman und Prohaska (1979), dass sich ver- 
meintlich kompetente Lehrpersonen aus Studierendensicht auch als kompetenter 
beschreiben, konnte repliziert werden. Unter Berücksichtigung der retrospektiv 
erfassten, initialen Wärmebeurteilung (erster Eindruck) und der Attraktivitätsbeur- 
teilung zeigte sich der mittlere Kompetenzeindruck im positiven Zusammenhang 
mit dem Erleben positiver Emotionen, von Flow und mit der eigenen Kom- 
petenz in einer Lehrveranstaltungssitzung sowie im negativen Zusammenhang 
mit dem Erleben von Störungsmissmanagement. Somit lässt sich aus den 
erzielten Ergebnissen schließen, dass auch Lehrpersonen von hohen Lernen- 
denkompetenzerwartungen an sie profitieren. Die eher kleinen bis mittelgroßen 
Zusammenhänge (.366 <|Bl < .401) sind in Anbetracht der Feldstudie und damit 
aufgrund vieler unterschiedlicher Beeinflussungen auf die Einschätzung einer spe- 
zifischen Lehrveranstaltungssitzung als bedeutsam einzuordnen. Außerdem ist es 
möglich, dass Lehrpersonen durch höhere Machtmittel in der asymmetrischen 
Lehr-Lern-Interaktion (u. a. Misamer, 2019; Steins, 2013; Thies, 2010) weni- 
ger in ihrem Erleben und Handeln durch die Lernenden beeinflusst werden als 
Lernende durch Lehrpersonen. Somit können also keine großen Effekte erwartet 
werden. Insgesamt kann resümiert werden, dass Lernendenkompetenzerwartun- 
gen die Lehr-Lern-Interaktion beeinflussen, und es braucht weitere Befunde, um 
die konkreten Auswirkungen auszumachen. 
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Limitationen und Starken 1 8 


Studienspezifische Limitationen sind bereits in den jeweiligen Kapiteln disku- 
tiert worden. Im Folgenden sollen übergreifende Limitationen aufgezeigt werden, 
die die Interpretation der Ergebnisse beeinflussen. Hier sind insbesondere sechs 
Aspekte zu berücksichtigen: (1.) Die ersten drei Studien fokussieren Lehrkräfte 
in allgemeinbildenden Schulen und die vierte Studie wurde im Hochschulkontext 
durchgeführt. Auch wenn davon ausgegangen werden kann, dass die allgemeinen 
Prozesse des Lehrens und Lernens, inklusive der Lehr-Lern-Interaktion, ähnlich 
verlaufen (vgl. Klein, 2011), sind die erzielten Ergebnisse nicht ohne weitere 
Überprüfung auf den jeweils anderen Kontext (oder weitere wie der Erwachsenen- 
bildung z. B. in Volkshochschulen) übertragbar. (2.) Ein zweiter Aspekt, der die 
Interpretation der Ergebnisse limitiert, liegt in der Stichprobenzusammensetzung. 
Die Teilnehmenden aller Studien waren Erwachsene. Es ist zwar davon auszuge- 
hen, dass die kognitiven Repräsentationen und (Geschlechts-)Stereotype innerhalb 
eines kulturellen Kontexts zwischen Erwachsenen, Kindern (ab 6 Jahren; insbe- 
sondere ab 10 Jahren) und Jugendlichen nicht wesentlich verschieden sind (vgl. 
Beelmann & Neudecker, 2020; Raabe & Beelmann, 2009), eine Untersuchung der 
Fragestellungen mit Kindern und Jugendlichen ist aber dennoch wünschenswert, 
um die Befunde zu unterstützen oder zu widerlegen und um ein differenziertes 
Bild zu erhalten (z. B. variierende Effektstärken). (3.) Ein weiterer, wesentlicher 
Kritikpunkt an der Methodik bezieht sich auf die Stichprobenziehung. Alle Stu- 
dien wurden mit Gelegenheitsstichproben (bzw. Ad-hoc-Stichproben; Döring & 
Bortz, 2016) mit einem allgemeinen Teilnahmeaufruf durchgeführt. Diese Form 
der Stichprobenziehung beinhaltet die Gefahr von Selbstselektions-Effekten und 
ist selten repräsentativ für die Gesamtbevölkerung resp. die Zielpopulation. Dies 
sollte für die Studien 1 und 2 weniger bedeutsam sein, da Stereotype sozial 
geteilte Wissensstrukturen sind (vgl. Cuddy et al., 2008; Stangor, 2009). Unter 
Berücksichtigung der Teilnehmendenstruktur kann davon ausgegangen werden, 
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dass die Ergebnisse zu den Stereotypen eher konservativer (also mit kleineren 
Effektenstärken) ausfielen, da hauptsächlich Proband*innen aus psycho-sozialen 
Berufen oder Studienfächern teilnahmen. Diese Teilnehmenden sollten aufgrund 
ihrer Ausbildung sensibler gegenüber Stereotypen sein (so geht etwa der funda- 
mentale Attributionsfehler mit weniger sozialpsychologischer Kompetenz einher; 
Gollwitzer & Bargh, 2018). Analoge Überlegungen lassen sich für Studie 3 
aufstellen. Besonders problematisch zeigte sich die Gelegenheitsstichprobe in 
Studie 4 bei den Dozierenden. In Anbetracht der besonders positiven Bewer- 
tungen der Lehrpersonen muss von einem Selektionseffekt ausgegangen werden, 
der die beobachtete Varianz einschränkt, jedoch die Richtung der aufgezeigten 
Zusammenhänge nicht beeinflussen sollte. (4.) Eine weitere Limitation betrifft 
die kleinen Stichprobengrößen, insbesondere in Studie 3 und die Lehrpersonen- 
Stichprobe in Studie 4 mit jeweils unter 70 Proband*innen. Trotz der Ziehung 
von Gelegenheitsstichproben war es schwer möglich, Personen zur Teilnahme an 
aufwendigeren Untersuchungen zu gewinnen. Dadurch reduziert sich die statis- 
tische Power deutlich, weswegen auch keine Anpassung des Signifikanzniveaus 
durchgeführt wurde — was die Power erneut reduziert und die Wahrscheinlich- 
keit für Beta-Fehler (Fehler 2. Art) erhöht hätte (vgl. Bortz & Schuster, 2010; 
Hager, 2004). Die Diskussion der Ergebnisse basierte deswegen auch stärker 
auf den erzielten Effektstärken. Um Verletzungen von Testvoraussetzungen zu 
begegnen und ausreißende Werte angemessen zu berücksichtigen, wurden die 
Ergebnisse zumeist mit Rangkorrelationen (nach Spearman) und Verfahren mit 
Bootstrap berechnet. (5.) Außerdem muss die Auswahl der Items beachtet wer- 
den. Die Items zur Erfassung der Kompetenz und Wärme sowie der Attraktivität 
wurden eigens für die Studien ausgewählt, ohne jedoch eine inhaltliche Vali- 
dierung durchzuführen. Die durchgeführten Faktoren- und Reliabilitätsanalysen 
unterstützen jedoch die theoretischen Überlegungen, die den Itemkonstruktionen 
zugrunde lagen. Allerdings ist davon auszugehen, dass die Kompetenz- und Wär- 
mebeurteilungen mit der verwendeten Likert-Skala subjektive Maße sind. Dies 
ist insbesondere für die Studien 1 und 2 problematisch, da dies zu einem shifting 
standard (Biernat et al., 1991; Foschi, 2000) geführt haben könnte und sich somit 
die Geschlechts-Professions-Assoziationen nicht einstellten, da die beschriebe- 
nen Personen in den Fallvignetten mit der jeweiligen Gruppe verglichen wurden 
(z. B. „für eine männliche Lehrkraft wirkt die Person ziemlich kompetent“). Es 
gibt also einen Bedarf der Replikation mit objektiven Maßen (z. B. Bewertung 
mit Punkten oder Einschätzung einer Erfolgswahrscheinlichkeit). Darüber hin- 
aus wurden einige der verwendeten, bereits validierten Skalen umformuliert bzw. 
Erhebungsinstrumente angepasst, um sie an die Gegebenheiten der jeweiligen 
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Studie anzupassen. (6.) Das Ziel, die Wirkung von Lernendenkompetenzerwar- 
tungen auf Lehrpersonen zu untersuchen, wurde mit Zusammenhangsanalysen 
in der vierten Studie (Feldstudie) umgesetzt. Dadurch können keine Aussagen zu 
Kausalitäten getroffen werden. Eine Untersuchung, die längsschnittlich (im Hoch- 
schulkontext z. B. über ein Semester) mit mehreren Messzeitpunkten verläuft 
und mit dem Erfassen der ersten Kompetenzerwartung bzw. -beurteilung beginnt, 
wäre ein angemessenes Verfahren, um sowohl Kausalaussagen zu ermöglichen 
als auch kurz- und langfristige Effekte von Lernendenkompetenzerwartungen zu 
betrachten. 

Neben diesen Limitationen sollen auch die wesentlichen Stärken der Studien 
erwähnt werden. (1.) Die Studien 1, 2 und 3 haben ein experimentelles Design 
und die Studien 1 und 2 mit randomisierter Zuordnung, sodass der Einfluss 
der Manipulationen kausal interpretiert werden kann. (2.) In Studie 3 standen 
keine individuellen subjektiven Angaben der Proband*innen im Fokus der Aus- 
wertung, sondern das nonverbale Verhalten der Proband*innen, was einerseits 
besonders aufwendig zu erheben ist und andererseits selten in der psycholo- 
gischen Forschung berücksichtigt wird (Döring & Bortz, 2016; Weber, 2012). 
(3.) Einige Stichprobengrößen in den Studien sind relativ klein, allerdings ist 
die Stichprobengröße der Lernenden in Studie 4 mit 663 Erstteilnahmen (ein- 
deutig identifizierbare Erstteilnahmen ап der Studie, da Mehrfachteilnahmen 
möglich waren) und insgesamt 871 Angaben (inkl. Mehrfachteilnahmen) groß. 
(4.) Neben Feldman und Prohaska (1979) sowie Feldman und Theiss (1982) ist 
die Studie 4 die einzige (deutsch- und/oder englischsprachige) Untersuchung, 
die die Zusammenhänge von Lernendenkompetenzerwartungen an Lehrpersonen 
mit der Wahrnehmung der Lehrpersonen von sich und der eigenen Lehre fokus- 
siert. Im Vergleich zu Feldman und Prohaska (1979) sowie Feldman und Theiss 
(1982) wurde zudem eine Feldstudie durchgeführt, was die externe Validität der 
Befunde erhöht (Döring und Bortz, 2016). (5.) Die vierte Studie berücksichtigte 
sowohl die Gruppen- als auch die Individualebene als Analyseeinheiten, um die 
Zusammenhänge der Lernendenkompetenzerwartungen auf die Lernenden selbst 
zu betrachten. Zumeist wird auf die unterschiedlichen Ebenen zu selbsterfül- 
lenden Prophezeiungen im Lehr-Lern-Kontext in Forschung und Theorie kaum 
eingegangen. Die erzielten Ergebnisse weisen auf die Bedeutsamkeit der Unter- 
scheidung hin, da die Gruppenebene auf Basis der erzielten Ergebnisse deutlich 
mehr Varianz aufklären kann als die Individualebene. 
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Praktische und theoretische 1 9 
Ableitungen 


Zusammengefasst weisen die Befunde der durchgeführten Studien auf einen 
Effekt der Lernendenkompetenzerwartungen an Lehrpersonen auf das Erleben 
und Verhalten von sowohl Lernenden als auch Lehrpersonen hin. Die Effekt- 
stärken und Zusammenhänge waren jedoch mehrheitlich klein, insbesondere 
in Bezug auf das nonverbale Verhalten der Lernenden und auch hinsichtlich 
des Erlebens der Lehrpersonen. Nichtsdestotrotz kann abgeleitet werden, dass 
hohe Lernendenkompetenzerwartungen im Zusammenhang mit positiven und 
erwünschten Lehr-Lern-Interaktionen stehen. Für Lehrpersonen ist es also för- 
derlich, hohe Kompetenz auszustrahlen — sowohl für die Lernenden als auch 
für sie selbst. Im Folgenden werden zuerst Ableitungen beschrieben, wie Lehr- 
personen kompetenter erscheinen und einen ersten Eindruck aktiv beeinflussen 
können, der selbsterfüllend wirken kann. Anschließend wird dies im Kon- 
text der Lehr-Lern-Interaktion, insbesondere mit Fokus auf die Gestaltung der 
Klassenführung, betrachtet. Abschließend werden, ergänzend zum Modell von 
Nickel (1985), Erwartungseffekte in einem synergetisch-systemischen Ansatz der 
Lehr-Lern-Interaktion beschrieben. 


19.1 Gestaltung des ersten Eindrucks zur Erhöhung der 
Lernendenkompetenzerwartungen an Lehrpersonen 


Die erzielten Ergebnisse können insbesondere für die Gestaltung von kurzen 
Lehr-Lern-Interaktionen sowie bei beginnenden Interaktionen, die für Erwar- 
tungseffekte besonders vulnerabel sind (vgl. bei Lehrendenkompetenzerwar- 
tungen Jussim & Harber, 2005), praktisch genutzt werden. Insbesondere die 
Gestaltung des ersten Eindrucks, den die Lernenden von der Kompetenz der 
Lehrperson aufbauen, kann auf verschiedene Arten beeinflusst werden, um einen 
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positiven Engelskreis in Gang zu setzen (vgl. Nickel et al., 1985) und um mögli- 
chen Geschlechts-Professions-Assoziationen zu begegnen (für Physik-Unterricht 
s. Degner et al., 2019; Zander et al., 2015; vgl. Studie 1 und Studie 2). 
Weitergehend kann die positive Anbahnung einer Kompetenzerwartung auch 
Eingang in die Konzipierung von Klassenführungstrainings (z. B. Hannemann, 
2020; Kiel et al., 2013) finden, die theoretische und praktische Schnittstellen zu 
selbsterfiillenden Prophezeiungen bieten. 

Kounin (2006, Original von 1976) konnte verschiedene Dimensionen erfolg- 
reicher Klassenführung ausmachen, darunter Allgegenwärtigkeit und Uberlap- 
pung. Dies beschreibt die Fähigkeit von Lehrpersonen, den Lernenden zu 
vermitteln, dass sie über die aktuelle Lehr-Lern-Situation informiert sind und ein- 
greifen können. Dies wird nach Kiel et al. (2013) u. a. mit Präsenzmaßnahmen 
umgesetzt. Präsenzmaßnahmen sind Maßnahmen, die den Lernenden aufzeigen, 
dass die Lehrperson im ganzen Raum präsent ist, alles in der Lehr-Lern-Situation 
im Blick hat und bei Störungen eingreift (vgl. Haag, 2018; Kiel et al., 2013). 
Dazu gehören u. a. Körpersprache, darunter Blickkontakt, Bewegung im Raum 
und selbstsicheres Auftreten. Diese Maßnahmen können Kompetenz vermitteln — 
und interaktionale, kognitive Schemata (Thies, 2010) bei den Lernenden entstehen 
lassen — und weitergehend die Lehr-Lern-Interaktion nach dem Modell von Nickel 
(1985) zu einem positiven Engelskreislauf führen. Kiel et al. (2013) unterscheiden 
dabei nonverbale und verbale sowie intervenierende und präventive Maßnahmen. 
Der Lehrberuf ist einer der Berufe, ,,[...] bei denen die Mechanismen nonverbaler 
Kommunikation eine größere Rolle spielen“ (Kiel et al., 2013, S. 59), die auch 
Kompetenz ausstrahlen können. 

Zum nonverbalen Verhalten beschreibt Mehrabian (1969), dass die Zugewandt- 
heit (immediacy), die sich in Berührung, Distanz, Vorbeugen, Blickkontakt und 
Körperausrichtung manifestiert, Sympathie gegenüber der anderen Person resp. 
Personen der Kommunikation vermittelt, sodass mit diesen Verhaltensweisen 
der Wärmeeindruck vermittelt wird. Dafür ist jedoch eine entspannte Körper- 
haltung notwendig bzw. förderlich. In Ergänzung zur Zugewandtheit bildet die 
Entspanntheit der Körperhaltung (relaxation) einen Hinweis auf Macht- bzw. Sta- 
tusunterschiede, die auch mit der Kompetenzwahrnehmung im Zusammenhang 
stehen können. Mehrabian (1969) beschreibt, dass eine mittlere Körperans- 
pannung am wohlwollendsten von Kommunikationspartner*innen aufgenommen 
wird. Eine mittlere Körperspannung sollte von Lehrpersonen in Kombination mit 
einem zugewandten Verhalten gezeigt werden, um sowohl Wärme als auch Kom- 
petenz auszustrahlen. Bisher zeigte sich zur Kompetenzwahrnehmung, dass eine 
zugewandte Körpersprache von Lehrpersonen mit der Wahrnehmung von höhe- 
rer Kompetenz verknüpft ist (Feldman & Prohaska, 1979; Gorham et al., 1997, 
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1999). Eine offene, nicht geschlossene Haltung sowie Nähe hingen mit positiv 
bewerteter Lehrperformanz zusammen (Barmaki, 2014). 

Zusätzlich zur Körperhaltung kann auch die Stimmhöhe einen Einfluss auf die 
Ausbildung von Kompetenzerwartungen haben. So beurteilten Proband*innen, die 
kein Wissen über die Fragestellung hatten, sowohl männliche als auch weibliche 
Stimmen, deren Ton technisch vertieft wurde, kompetenter und vertrauenswiirdi- 
ger als Stimmen, deren Ton technisch erhöht wurde. Allerdings wurden technisch 
erhöhte Frauenstimmen wärmer bzw. sympathischer wahrgenommen als technisch 
vertiefte Frauenstimmen (Oleszikiewicz et al., 2017), für männliche Stimmen 
konnte kein Unterschied in Bezug auf die Wärme ausgemacht werden. Eine 
andere Studie zeigte, dass vocal feminity weniger kompetent bewertet wird als 
vocal masculinity, aber es konnte kein Unterschied hinsichtlich der Wärmebe- 
urteilung ausgemacht werden (Ko et al., 2009). Krahé und Papakonstantinou 
(2020) zeigten hingegen, dass sich hohe Stimmen und tiefe Stimmen zwar hin- 
sichtlich der Wärmebeurteilung, allerdings nicht bei der Kompetenzbeurteilung 
unterschieden. Die Befunde müssten künftig systematisch betrachtet werden. 
Nichtsdestotrotz können die Befunde in der Summe als Indizien dafür gedeutet 
werden, Kompetenz durch eine tiefe Stimme zu vermitteln sowie Wärme durch 
eine hohe Stimme. Ein Training zur gezielten Stimmmodulation kann deswegen 
im Lehrberuf (nicht nur zur Schonung der Stimme) sinnvoll sein. 


Die Sprechrate hat einen starken Effekt darauf, wie kompetent eine Stimme erscheint. 
Ein schneller Sprecher, der 7. B. keine Füllsel wie „äh“, „ähm, „hmm“, „јаа“ verwen- 
det, erscheint überzeugender und intelligenter. Wenige Sprechpausen und weniger 
Wiederholungen sowie eine dynamische Stimme signalisieren Kompetenz. Laute und 
männliche [tiefe] Stimmen werden – im Gegensatz zu weichen, sanften, weiblichen 
[hohen] Stimmen - als „konsequent wirkend“ wahrgenommen. [...] Intonation und 
Sprechrate sind aber stets durch die jeweilige Sprache, die Situation [...] und/oder 
durch den/die Zuhörer bestimmt, ähnlich der Lautstärke eines Sprechers, die themen- 
gemäß und raumangemessen sein muss. (Kiese-Himmel, 2016, S. 32) 


Weitergehend kann auch die Kleidung Informationen zur Kompetenz einer Person 
liefern. Formale Kleidung kann (als Lehrperson) mit höherer Kompetenzzuschrei- 
bung einhergehen (Morris et al., 1996; Gorham et al., 1999), jedoch wird auch das 
Ausbleiben von Vorteilen formaler Kleidung beschrieben (Gorham et al., 1997). 
Gorham et al. (1999) erklären, dass der Zusammenhang von Kompetenzzuschrei- 
bung und formaler Kleidung durch das Alter der Dozierenden erklärt werden 
kann: Je älter die Dozierenden sind, desto formaler kleiden sie sich, und ältere 
Dozierende werden allgemein kompetenter beschrieben als jüngere. In Studie 4 
konnte jedoch kein bedeutsamer Zusammenhang von Kompetenzzuschreibung 
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und Alter der Dozierenden ausgemacht werden, sodass angenommen werden 
kann, dass Kleidung als eine Moderatorvariable wirkt. Neben der formellen Klei- 
dung kann die Farbe Rot offenbar zur Wahrnehmung von mehr Kompetenz und 
Kompetitivität führen (Maier et al., 2013; vgl. Elliot & Maier, 2014). Diese 
Hinweise müssten jedoch gezielt für den Lehr-Lern-Kontext untersucht wer- 
den, z. B. indem in experimentellen Untersuchungen Lehrpersonen systematisch 
andere Kleidung tragen. 

Carli et al. (1995) verglichen unterschiedliche Referierendenstile miteinander. 
Dabei zeigte sich, dass Referierende mit einem „unterwürfigen“ Stil (submis- 
sive style) die geringsten Kompetenzzuschreibungen erhielten. Dieser Stil ist 
geprägt durch „a soft, pleading voice with many hesitations and stumbles, a 
slumped posture, nervous hand gestures, and an avert gaze“ (Carli et al., 1995, 
S. 1033). Die besten Bewertungen fielen auf den sozialen (social style) und den 
aufgabenorientierten Stil (task style): 


The social style included a voice of moderate volume, a relaxed posture with the body 
leaning toward the listener, a friendly facial expression, and a moderately high amount 
of eye contact. The task style included a rapid rate of speech, a firm tone of voice, 
moderate voice volume, few hesitations, an upright posture, calm hand gestures, and 
a moderately high amount of eye contact. (Carli et al., 1995, S. 1034) 


Der Ausdruck von Allgegenwärtigkeit und Präsenz durch Lehrpersonen, der mit 
der Kompetenzwahrnehmung aufseiten der Lernenden einhergehen kann, sollte 
schon früh in die Ausbildung von Lehrpersonen eingehen, z. B. in der Vor- 
bereitung auf erste Praxiserfahrungen im Lehramtsstudium (vgl. Hannemann, 
2020). Eine zugewandte, offene Haltung mit moderater Körperspannung, eine 
der Situation angepasste Stimmmodulation sowie angemessene Kleidung können 
den ersten Eindruck, für den es sprichwörtlich keine zweite Chance gibt, positiv 
beeinflussen. 

Auch wenn die bisherigen Studienergebnisse auf Ansätze zur Steigerung 
von Lernendenkompetenzerwartungen an Lehrpersonen hinweisen, müssen diese 
weiter untersucht werden. Welche Aspekte neben Stimme, Haltung, Positio- 
nierung und Kleidung relevant sind, müsste systematischer analysiert werden. 
Dafür ist es möglich, verschiedene Einflüsse auf die Kompetenzwahrnehmung 
offen zu erfragen (z. B. „Woran erkennen Sie beim Kennenlernen eine kom- 
petente Lehrperson?“), die dann inhaltsanalytisch ausgewertet und weitergehend 
faktoranalytisch geclustert werden. So können verschiedene Kompetenzmarker 
untersucht und deren Bedeutung auch für unterschiedliche Lehr-Lern-Kontexte 
(z. B. Schule, Hochschule, Erwachsenenbildung) verglichen werden. 
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19.2 Lernendenkompetenzerwartungen in weiteren 
Ansätzen zur Gestaltung der Lehr-Lern-Interaktion 


Neben den eher oberflächlichen Methoden, die auf den ersten Eindruck abzie- 
len, ist es zudem wichtig, eine lernförderliche Lehr-Lern-Interaktion herzustellen. 
Dies ist sowohl Aufgabe der Lehrpersonen als auch der Lernenden. Die Bedeu- 
tung von Lernendenkompetenzerwartungen kann in verschiedenen Theorien 
wiedergefunden werden, auch wenn sie keine explizite Erwähnung erfahren. 
Folgend sollen beispielhaft Ansätze erläutert werden, bevor auf synergetisch- 
systemische Betrachtungen detaillierter eingegangen wird, um die oben genannten 
Hinweise zur Gestaltung des ersten Eindrucks theoretisch zu verorten und wei- 
tere Forschungsansätze aufzuzeigen, die das kognitiv geprägte Modell von Nickel 
(1985) ergänzen. 

Das COACTIV-Modell (Baumert & Kunter, 2006; Kunter et al., 2011) lis- 
tet und strukturiert verschiedene Aspekte der professionellen Kompetenz von 
Lehrpersonen. Neben dem als zentral angesehenen Professionswissen werden 
die motivationalen Orientierungen, die Überzeugungen und Werthaltungen sowie 
die selbstregulatorischen Fähigkeiten benannt. Zum Professionswissen gehört 
auch das pädagogisch-psychologische Wissen (Kompetenzbereich). Zu diesem 
Kompetenzbereich (in den Kompetenzfacetten „effektive Klassenführung“ und 
„Wissen über Lernprozesse“) können die hier erzielten Ergebnisse zugeordnet 
werden. Lehrpersonen sollte klar sein, dass nicht nur die Lehrendenerwartungen 
eine Rolle in der Interaktion spielen, sondern auch die Lernendenerwartun- 
gen, und dass Letztere sich u. a. auf den Lernerfolg der Lernenden auswirken 
können (Wissen über Lernprozesse; Zusammenhang von Lernendenkompeten- 
zerwartungen und Lernerfolg bei Adediwura & Tayo, 2007; Edwards et al., 
2009; Feldman & Prohaska, 1979; Jamieson et al., 1987). Die besondere Bedeu- 
tung der Warmewahrnehmung fiir das sozial-emotionale Erleben in Lehr-Lern- 
Kontexten (vgl. Studie 4) ist auch ein Aspekt, der zum Klassenfiihrungswissen 
gezählt werden kann. Welche weiteren Formen von Lernendenerwartungen, 
u. a. Kompetenzerwartungs-Erwartungen (s. Kapitel 4), bedeutsam sind, müsste 
zukünftig in weiteren Studien untersucht werden. 

Marzano et al. (2003) beschreiben die Lehr-Lern-Beziehung als Schlüssel, 
um effektive Klassenführung umzusetzen. Der durchschnittliche Effekt der Lehr- 
Lern-Beziehung auf störungsfreien Unterricht liegt bei d = 0.869, doch je jünger 
die Schüler*innen sind, desto höher fallen die Effektstärken aus (von d = 0.549 
bei High School bis d = 2.891 bei Middle School/Junior High). Um eine 
gute Lehr-Lern-Beziehung herzustellen, benennen Marzano et al. (2003) drei 
Handlungsschritte (action steps; vgl. Haag, 2018): 
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1. Etablierung eines angemessenen Grades an Dominanz 
e Festes, bestimmendes, durchsetzungsfähiges Verhalten ohne Aggressivität 
mit aufrechter Haltung, Blickkontakt sowie angemessenem Tonfall und 
klarer Aussprache 
e Klare, früh beschriebene Lernziele inklusive Feedback zur Zielerreichung 
2. Kommunikation eines angemessenen Grades an Kooperation 
e Vorsehen flexibler Lernziele 
e Zeigen von Interesse an Lernenden 
• Präsenzmaßnahmen, 7. B. Blickkontakt durch den ganzen Raum, sich im 
Raum bewegen 
e Angemessenes Reagieren auf inkorrekte Antworten (Positives hervorheben) 
3. Berücksichtigung der Bedürfnisse von Lernendentypen und individuellen 
Besonderheiten der einzelnen Lernenden 


Die Balance von Dominanz und Kooperation steht also nach Marzano et al. 
(2003) im Mittelpunkt für eine effektive Lehr-Lern-Interaktion. Dabei lassen sich 
die Maßnahmen, die mit der Kompetenz- und Wärmewahrnehmung im Zusam- 
menhang stehen wie Körperhaltung und Stimmmodulation, direkt wiederfinden. 
Für Mazano et al. (2003) ist es für die Gestaltung der Lehr-Lern-Interaktion von- 
seiten der Lehrpersonen wichtig, ein angemessenes Maß an Dominanz und Macht 
(dominance) zu demonstrieren, das Kompetenz ausstrahlen und somit hohe Kom- 
petenzerwartungen bei den Lernenden induzieren kann, sowie bereit dafür zu 
sein, die Führung zu übernehmen. Lehrpersonen müssen demnach angemessen 
mit ihren Machtmitteln umgehen lernen (vgl. Misamer, 2019). 

Auch wenn in der Lehr-Lern-Situation die Lehrpersonen mehr Machtmittel 
zur Verfügung haben (vgl. Misamer, 2019; Steins, 2013; Thies, 2010), kön- 
nen Lernende das Lehr-Angebot mit den ihnen gegebenen Machtmitteln aktiv 
transformieren. Steins (2013) beschreibt unterschiedliche Formen von Machtmit- 
teln, die auch Lernende haben. Es gibt für Lernende die Möglichkeit, (1.) durch 
soziale Anerkennung, Aufmerksamkeit und positives Feedback die Lehrperson 
zu belohnen (Belohnungsmacht), aber auch (2.) durch Ausbleiben der Mitar- 
beit, Sabotieren des Unterrichts sowie durch Gerüchte und Beleidigungen zu 
bestrafen (Bestrafungsmacht bzw. Macht zu zwingen). (3.) Weitergehend haben 
Schüler*innen in Schulen einen Rechtsanspruch auf Bildung, aber auch im Stu- 
dium und in der Erwachsenenbildung kommt (mehr oder weniger) ein Vertrag 
zustande, der von beiden Seiten erfüllt werden muss (legitimierte Macht). Weitere 
Formen der Machtmittel sind (4.) die Referenzmacht (Beliebtheit, überzeugen- 
des Auftreten), (5.) die Expertisemacht (Fähigkeiten und Kompetenz), (6.) die 
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Informationsmacht (Position, etwas mitteilen zu können) und (7.) die ökolo- 
gische Macht (Fähigkeit zur Gestaltung der Umwelt). Je älter die Lernenden 
werden, desto stärker können sie mit ihren Machtmitteln wirken. Insbesondere 
die Expertise- und die Informationsmacht sind für ältere Lernende von besonde- 
rer Bedeutung in der Lehr-Lern-Interaktion sowie bei der Einflussnahme auf den 
Lehr-Lern-Prozess. Bei einer wahrgenommenen geringeren Fachkompetenz der 
Lehrpersonen, also geringen Lernendenkompetenzerwartungen, kann die eigene 
Expertisemacht genutzt werden, um den Unterricht für alle zu bereichern und 
die fehlende Fachkompetenz der Lehrperson auszugleichen. Dies sollte in einer 
empathischen, wertschätzenden Form passieren. Darüber hinaus sollte den Ler- 
nenden bewusst sein, dass Lehrpersonen neben der Fachkompetenz zumeist auch 
pädagogische Kompetenz (z. B. zur Anregung zum selbstgesteuerten Lernen) mit- 
bringen (vgl. Baumert & Kunter, 2006; Helmke, 2017; Kunter et al., 2011) sowie 
Lernende und Lehrpersonen gemeinsam ein positives, lernförderliches Klima auf- 
bauen können. Sollten Lernende mit der fachlichen Expertise der Lehrperson 
in einer Lernsituation nicht zufrieden sein, haben sie meist die Möglichkeit, 
mit den Lehrpersonen über die Gestaltung der Lehre zu sprechen (insbesondere 
in der Erwachsenenbildung; Informationsmacht). Um dies erfolgreich umzuset- 
zen, sind Empathie für die Lehrperson und Perspektivwechsel förderlich (vgl. 
Steins, 2013). So könnten im Hochschulkontext Studierende in Absprachen mit 
Dozierenden treten, wie die Lehr-Lern-Situation konkret umgesetzt wird, z. B. 
selbstgesteuertes Lernen versus Frontalunterricht, und welches Prüfungsformat 
unter Berücksichtigung der Modulhandbücher angemessen ist (im Sinne des con- 
structive alignment; vgl. Biggs & Tang, 2011). Es kann also argumentiert werden, 
dass Lehrpersonen ihre Kompetenzen transparent machen sowie professionell mit 
Schwächen und Unwissen umgehen sollten (vgl. Thies et al., 2016). 

Ein weiteres Modell, in dem Lernendenkompetenzerwartungen relevant sind, 
ist das Modell von Helmke (2017) zur Wirkungsweise von Unterricht. Nach 
Helmke (2017) unterbreitet die Lehrperson mit ihrem Unterricht ein Ange- 
bot. Dieses Angebot muss jedoch wahrgenommen und zudem genutzt werden, 
was wiederum vom Lernpotenzial der lernenden Personen abhängt, zentral 
sind hierbei „Vorkenntnisse, Sprache(n), Intelligenz, Lern- und Gedächtniss- 
trategie; Lernmotivation, Anstrengungsbereitschaft, Ausdauer, Selbstvertrauen“ 
(Helmke, 2017, S. 71). Hier müssten die kognitiven Schemata ergänzt wer- 
den — sowohl interaktional, relational (vgl. Thies, 2010) als auch normativ im 
Sinne von Rosemann (1978) sowie hinsichtlich der (Kompetenz- und Wärme-) 
Erwartungen (in Anlehnung an das stereotype content model; s. Kapitel 5). In 
dem heuristischen Modell von Aldrup (2017) wird davon ausgegangen, dass 
die Lehr-Lern-Interaktion und -Beziehung psychologische Grundbedürfnisse wie 
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Kompetenz- und Autonomieerleben sowie soziale Eingebundenheit (gemäß der 
Selbstbestimmungstheorie von Deci & Ryan, 2012) befriedigen kann und dadurch 
zu positiven Outcomes sowohl aufseiten der Lernenden als auch der Lehrpersonen 
(insbesondere deren berufliches Wohlbefinden) führt. Diese Outcomes wiederum 
beeinflussen die Lehr-Lern-Beziehung. 

Das Ziel von Lehrpersonen und Lernenden muss es sein, gemeinsam Situa- 
tionen zu schaffen, in denen sowohl Lernen als auch ein gutes Lehr-Lern-Klima 
ermöglicht werden. Lernende sollten ihre Schemata hinterfragen, z. B.: Muss 
die Lehrperson mir Wissen vermitteln oder die Lernsituation herstellen? Wie 
eigenständig muss ich mich selbst in den Lernprozess integrieren? Dürfen 
Lehrpersonen (auch fachliche) Schwächen haben? 


19.3 Synergetisch-systemische Betrachtungen auf die 
Lehr-Lern-Interaktion 


Das Vorgehen der durchgeführten Studien orientierte sich an deterministisch- 
kausalen Untersuchungen und Überlegungen, die experimentelle methodische 
Standards erfüllen (vgl. Döring & Bortz, 2016), und basierte auf der kognitiven 
Perspektive des transaktionalen Modells der Lehr-Lern-Interaktion von Nickel 
(1985). Alternativ kann für die gewählte Fragestellung eine übergreifende sys- 
temische Perspektive eingenommen (u. a. Hubrig & Herrmann, 2014) werden. 
Soziale Systeme — also auch die Lehr-Lern-Interaktion resp. die Lehr-Lern- 
Gruppe — sind dynamisch, komplex und nicht-linear (u. a. Strunk & Schiepek, 
2006). So lassen sich Nickels (1985) Überlegungen auch in synergetisch- 
systemische Konzepte übersetzen (vgl. Thies, 2017). 

Im Rahmen der Synergetik (Haken & Schiepek, 2010; Schiepek et al., 
2013) lassen sich für die Lehr-Lern-Interaktion zwei Ebenen unterscheiden: 
(1.) eine mikroskopische Ebene, die durch psychische Systeme („Elemente“), 
die miteinander in Beziehung stehen, gekennzeichnet ist, und (2.) eine makro- 
skopische Ebene, die durch spezifische Muster der Interaktion der Elemente 
untereinander bestimmt ist. Die Elemente innerhalb der Lehr-Lern-Interaktion 
sind die Lehrpersonen und Lernenden. Soziale Systeme bestehen aus mindestens 
zwei psychischen Systemen (bzw. Personen), die in gegenseitiger Wechsel- 
wirkung stehen (,,Zirkularitat“). Psychische Systeme sind durch Kognitionen 
(darunter Wahrnehmung und Erwartungen), Emotionen und Verhalten gekenn- 
zeichnet, die als Elemente des psychischen Systems in zirkulärer Beziehung 
stehen und Kognitions-Emotions-Verhaltens-Muster (Tschacher, 1997) bilden. 
Die in der Studie 3 diskutierten unterschiedlichen „Langeweileprofile“ Können als 
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unterschiedliche Formen der Kognitions-Emotions-Verhaltens-Muster betrachtet 
werden. Die zirkuläre Beziehung und wechselseitige Bezogenheit von Lernenden 
und Lehrpersonen sind Kern des Modells von Nickel (1985). 

Die Interaktionsmuster zwischen Lehrpersonen und Lernenden sind selbstor- 
ganisiert: Die Lerngruppe inklusive der Lehrperson(en) schafft sich eigenständig 
(und häufig automatisiert) gemeinsame Wirklichkeitskonstruktionen, implizite 
und explizite Regeln sowie Routinen („Attraktoren“ bzw. „Ordner“), die nicht 
von außen vorgegeben werden (vgl. Schallnus, 2006). Diese beobachtbaren Ord- 
nungsmuster entstehen mit der Zeit, d. h., sie emergieren und reduzieren die 
Freiheitsgrade der Interaktion (,,Versklavungsprinzip“; Haken & Schiepek, 2010) 
und machen sie somit vorhersagbarer. Welche von vielen möglichen „Ordnern“, 
also z. B. welche Routinen, sich in einem sozialen System durchsetzen, ist 
von vielen Faktoren abhängig. Auch Stereotype, u. a. Geschlechts-Professions- 
Assoziationen (vgl. Studie 1 und Studie 2), einzelner Personen können als 
intrasystemische „Kontrollparameter“ fungieren und Interaktionsmuster emergie- 
ren lassen. Generell ist aufgrund der stärkeren Machtposition der Lehrpersonen 
(u. a. Misamer, 2019; Steins, 2013; Thies, 2010) im Vergleich zur Position der 
Lernenden die Wahrscheinlichkeit höher, dass intrasystemische Ordnungsbildung 
häufiger vonseiten der Lehrpersonen ausgeht. Dies kann ein Grund sein, warum 
die Lehrpersonen in Studie 4 weniger von den Lernendenkompetenzerwartungen 
beeinflusst sind. Da mehrere Ordner in Konkurrenz miteinander stehen, kann es 
sein, dass sich das Ordnungsmuster mit der Zeit oder je nach Situation verändert. 

Wenngleich soziale Systeme selbstorganisiert sind, stehen sie dennoch im Aus- 
tausch mit der Umwelt (Energie, Informationen, Ressourcen). Der soziokulturelle 
Bezugsrahmen nach Nickel (1985) findet in der synergetischen Theorie in der 
Umwelt des Systems seine Entsprechung. So können Informationen von außen — 
wie dies bei einer Erwartungsmanipulation im Sinne des Pygmalion-Effekts 
nach Rosenthal und Jacobsen (1966, 1971) der Fall war — auf das Lehr-Lern- 
System als Kontrollparameter wirken und weitergehend neue Ordnungszustände 
anregen. Auch in Studie 3 konnte durch die Kompetenzmanipulation als Kon- 
trollparameter von außen das Verhalten der Teilnehmenden beeinflusst werden. 
Da soziale Systeme aber nicht-trivial und selbstreferenziell sind (von Foerster, 
1997), d. h. immer in Abhängigkeit des aktuellen Systemzustands reagieren, 
kann keine gezielte Einflussnahme von außen erfolgen, sondern lediglich eine 
Verstörung (,,Perturbation“), die eine wie auch immer geartete Änderung des Ord- 
nungszustands nach sich zieht. Dadurch lässt sich theoretisch erklären, warum 
Erwartungsmanipulationen zum Teil die Lehr-Lern-Interaktion beeinflussen kön- 
nen und zum Teil nicht. So zeigte sich die selbsterfüllende Prophezeiung bei 
Rosenthal und Jacobson (1966, 1971) lediglich in den Schulklassen 1 und 2, aber 


174 19 Praktische und theoretische Ableitungen 


nicht mehr in den Klassenstufen 3 bis 6. Dies kann auf Basis der Synergetik 
wie folgt erklärt werden: Im Laufe der Zeit verfestigen sich die Interaktionsmus- 
ter zwischen Lehrpersonen und Lernenden. Dabei wird das psychische System 
der Lehrpersonen so beeinflusst, dass sich ein stabiles Kognitions-Emotions- 
Verhaltens-Muster innerhalb der Lehr-Lern-Interaktion ausbildet und die bisher 
aufgebauten Gedanken über und Verhalten gegenüber den Lernenden durch die 
Kompetenzmanipulation nicht perturbiert werden kann. Der innere Systemzustand 
ist also nicht sensibel für den potenziellen Kontrollparameter aus der Umwelt. 

Die widersprüchlichen Studienergebnisse von Feldman und Prohaska (1979) 
und Feldman und Theiss (1982) über das Erleben von Lehrpersonen können mit- 
hilfe der Synergetik ebenfalls erklärt werden. Bei Feldman und Prohaska (1979, 
Studie 2) wurde nicht direkt die Auswirkung der Lernendenkompetenzerwartun- 
gen auf die Lehrpersonen betrachtet. So waren Lehrpersonen entweder einem 
zugewandten oder einem nicht-zugewandten Verhalten von vermeintlichen Ler- 
nenden (und tatsächlichen Konföderierten) ausgesetzt. Es wurde zwar vorher 
festgestellt, dass sich Lernende, die eine kompetente Lehrperson erwarteten, zuge- 
wandter verhalten (Feldman & Prohaska, 1979, Studie 1), aber eine Kompetenzer- 
wartung hielten die Konföderierten nicht. Das zugewandtere Verhalten kann als 
intrasystemischer Kontrollparameter das Kognitions-Emotions-Verhaltens-Muster 
der Lehrperson „versklavt“ haben, sodass sie sich wohlfühlte, die lernende Per- 
son sympathischer fand und sich adäquater verhielt. Feldman und Theiss (1982) 
wiederum manipulierten sowohl die Kompetenzerwartung der Lernenden als auch 
der Lehrpersonen. Die Kompetenzmanipulation für die Lehrpersonen konnte als 
äußerer Kontrollparameter das Erleben der Lehrpersonen „ordnen“, während die 
Kompetenzmanipulation der Lernenden das Erleben der Lernenden selbst anregte. 
Durch die stärkere Machtposition der Lehrperson konnte sich der Pygmalion- 
Effekt auf Basis der Lehrendenkompetenzerwartungen durchsetzen, während die 
Manipulation der Lernendenkompetenzerwartungen in der kurzen Zeit „пиг“ das 
psychische System der Lernenden beeinflusste und keinen Ordnungszustand des 
sozialen Systems ermöglichen konnte. 

In der Studie 4 wurden universitäre Lehrveranstaltungen nach mindestens 
einer, immer aber innerhalb der ersten fünf Sitzungen untersucht, in denen 
die Lernenden die jeweilige Lehrperson schon kannten (im Mittel bereits seit 
etwa einem halben Jahr). In dieser Zeit konnten erste Lernendenkompeten- 
zerwartungen an Lehrpersonen die Lehr-Lern-Interaktion bereits beeinflussen 
und es zeigten sich kleine bis mittelgroße Effekte auf das Erleben positi- 
ver Emotionen, von Flow, von Störungen und Störungsmissmanagement sowie 
auf die eigene Kompetenzwahrnehmung aufseiten der Lehrpersonen. Die Ler- 
nendenkompetenzerwartungen auf der Mikroebene konnten somit theoretisch 
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als systemimmanenter Kontrollparameter (vgl. Haken & Schiepek, 2010) die 
Makroebene, also die Lehr-Lern-Interaktionsmuster, „mitordnen“. Im Vergleich 
zu Feldman und Prohaska (1979) sowie Feldman und Theiss (1982) konnten 
die Lernendenkompetenzerwartungen in der Lehr-Lern-Interaktion zeitlich länger 
wirksam sein und stabilere Muster herausbilden. Welche Rolle die Zeit bei der 
Wirkung von Lernendenkompetenzerwartungen spielt, muss in weiteren Studien 
geklärt werden. Konkret braucht es also wie bereits erwähnt längsschnittliche 
Untersuchungen, um die Wirkung der Kompetenzerwartungen bei längerfristi- 
gen Lehr-Lern-Interaktionen wie in Schule, Hochschule und Erwachsenenbildung 
ausmachen zu können. 

Die Prozesshaftigkeit der Lehr-Lern-Interaktion kann außerdem z. B. mit 
state space grids analysiert werden (Pennings & Mainhard, 2016). Mit state 
space grids können Zustände eines Systems und Abfolgen der Zustände gra- 
fisch in einem zweidimensionalen Gitter dargestellt werden. So ist es denkbar, 
das Verhalten von Lehrpersonen und Lernenden zu betrachten, wenn die Kom- 
petenzerwartungen der Lernenden manipuliert wurden. Auch denkbar wären 
Eyetracking-Studien, um den Blickkontakt in Abhängigkeit der Kompetenzerwar- 
tungen in Lehr-Lern-Interaktionen genauer zu untersuchen. Durch diese Formen 
der Untersuchungen könnte ausgemacht werden, welche Reaktionen der Lehrper- 
sonen negative Interaktionsspiralen (vgl. Nickel, 1985) vorbeugen bzw. positive 
aufbauen. Nichtsdestotrotz ist es für empirische Überprüfungen unmöglich, alle 
Faktoren eines sozialen Systems auszumachen oder gar zu kontrollieren. Deshalb 
es ist sinnvoll, einen zirkulären Prozess in seine Teile zu gliedern, um systema- 
tisch relevante Teilbereiche zu identifizieren und somit ein System beschreibbar 
zu machen (Kriz, 2007). So schreibt auch Witte (2017, S. 1): „Dieser qualita- 
tive, nicht überbrückbare Unterschied zwischen einer elementaristisch-kausalen 
und einer synergetisch-systemischen Position existiert nicht. Es lässt sich viel- 
mehr die Haltung rechtfertigen, dass die elementaristisch-kausale Position eine 
Vereinfachung der synergetisch-systemischen Betrachtung darstellt.“ 


19.4 Restimierendes Fazit 


Die Untersuchungen zu Erwartungseffekten in der Lehr-Lern-Interaktion haben 
sich seit Rosenthal und Jacobson (1966, 1971) in mehrere Richtungen entwickelt: 
In einigen wissenschaftlichen Betrachtungen stehen die Lehrendenerwartungen 
im Fokus, in anderen die Lernendenerwartungen (vgl. u. a. Ludwig, 2018). 
Lediglich in zwei Studien wurden die Lernendenkompetenzerwartungen als Prä- 
diktor für Lehrendenerleben und -verhalten betrachtet (Feldman & Prohaska, 
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1979; Feldman & Theiss, 1982). Diese Forschungslücke wurde auf Basis des 
transaktionalen Modells der Lehr-Lern-Interaktion von Nickel (1985) mit der 
vorliegenden Arbeit mit aufeinander aufbauenden Studien adressiert. Lernen- 
denkompetenzerwartungen haben einen Einfluss auf die Interaktionsgestaltungen 
im Lehr-Lern-Kontext, jedoch muss auf Basis der erzielten Daten von einem 
kleinen Effekt auf das Erleben und Verhalten von Lehrpersonen ausgegangen 
werden. Inwieweit sich dieser Effekt langfristig verkleinert, verstetigt oder sogar 
vergrößert, kann auf Basis der durchgeführten Studien und vorangehender Unter- 
suchungen nicht vorhergesagt werden. Weitergehend bleibt die Frage offen, wie 
andere Erwartungen, z. B. hinsichtlich Wärme und Vertrauenswürdigkeit, in Inter- 
aktion mit den Kompetenzerwartungen aufseiten der Lernenden bedeutsam sind. 
Außerdem gibt es weitere Erwartungen, die in der Lehr-Lern-Interaktion relevant 
sein könnten, wie z. B. Erwartungs-Erwartungen. Es braucht mehr Forschung, 
um die Bedeutung der Lernendenerwartungen für die Lehr-Lern-Interaktion 
beschreibbar zu machen. 
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